测: 实时扫描涨停、跌停股票,记录其数量、封单金额、封成比(封单额/流通市值)、以及盘中打开涨停/跌停的次数。监测振幅异常(例如日内振幅超过15%)的股票。这些是市场情绪亢奋或恐慌的“温度计”。
◦ 创新高新低: 统计创52周新高和新低的股票数量。创新高代表强势和乐观情绪的扩散,创新低则相反。
【技术实现与挑战】
• 数据量巨大,对实时处理能力和存储架构提出挑战。陆孤影优化了系统的数据流处理模块,采用分层存储和分布式计算(在单机多核环境下模拟),对原始行情数据进行实时聚合,计算衍生指标,并将结果存入高性能时序数据库。
• 不同数据源(如股票和期货)的时间戳同步、数据清洗(处理异常值、停牌、除权除息等)是繁琐但必须确保准确的基础工作。他编写了自动化的数据校验和清洗脚本。
------
第二类:衍生品与信用交易数据
这类数据直接反映了杠杆投资者和专业机构对未来的预期和当下的风险偏好。
【采集目标与方式】
1. 股指期货数据: 实时获取沪深300、中证500、上证50等主要股指期货主力合约的价格、成交量、持仓量,以及其相对于现货指数的升贴水(基差)。升贴水的幅度、变化方向、以及期货持仓量的变化,是洞察机构情绪和期现套利资金动向的窗口。持续的深度贴水往往预示着悲观预期。
2. 融资融券数据: 每日收盘后,从交易所公开信息或数据服务商获取前一日全市场及分行业的融资余额、融资买入额、融券余额、融券卖出量。重点关注融资买入额占市场总成交额的比例(反映杠杆追涨情绪)、融资余额的环比变化(反映杠杆资金进场/离场速度)、以及融券余额的变化(反映主动做空力量)。
3. 期权市场数据(尝试获取): 如果数据接口支持,尝试获取上证50ETF、沪深3
本章未完,请点击"下一页"继续阅读! 第2页 / 共6页