文/中信证券股份有限公司 于新利 方兴 王桂强 苑博文
国际化浪潮中的挑战与破局
在全球金融市场深度融合与数字化转型的推动下,证券行业正经历着前所未有的变革。跨境资本流动加速、金融产品复杂度攀升、隐蔽关联风险激增,传统风控体系面临三重核心挑战 :全球化客户身份穿透难、统一资产视图与授信管理缺失、复杂关联风险识别滞后。
在此背景下,中信证券积极响应国家“人工智能+”战略,以图技术赋能风控、合规、投研、财富管理等业务,研发了面向证券业务的一站式通用智能图谱平台,实现10余个领域的率先突破,通过技术创新重塑风控合规体系,助力投研与财富管理领域,构筑了金融安全底座,为行业数智化转型提供范本。
技术架构 :基于HTAP架构的一站式通用智能图谱平台
在金融业数据库信创化浪潮的背景下,2021年中信证券决定打造一站式通用智能图谱平台,通过HTAP架构等技术创新,有效突破了传统技术瓶颈并解决了业务痛点,显著提升了中信证券数智化水平。
1. 自主可控的一站式通用智能图谱平台
中信证券一站式通用智能图谱平台,采用微服务技术进行开发,实现了低耦合、高内聚、可扩展、易维护的能力,构建了“存储与计算层—核心功能层—工具模块层—应用层”四层架构(见图1)。
存储与计算层 :存储层支持十亿级节点与关系的分布式存储,数据吞吐效率较传统方案提升10倍。计算层基于HTAP架构,实现实时查询(TP)与离线计算(AP)物理隔离,保障关键业务稳定性。
核心功能层 :包括图数据导入、图谱构建、图谱分析、高阶功能等内容,具体的图数据导入支持结构化数据、半结构化数据和实时流数据 ;图谱分析支持智能搜索、可视化分析和代码式查询 ;高阶功能提供深度图学习与计算能力和API管理功能。
工具模块层 :为提升核心功能的易用性,平台具有产品化的数据导入工具、可视化查询工具、图分析工具、API管理工具等。
应用层 :提供API服务、可视化交互、规则配置等12类功能模块,覆盖超10余个应用场景。
该平台满足“图谱构建—图谱管理—图谱应用”的完整生命周期,实现了对业务人员图谱分析探查友好,对图谱开发人员易用、可自主开发,对下游系统好对接,对运维人员管理方便的项目目标。特色功能有智能搜索,其将文本搜索引擎与图谱探查相结合,大大降低了业务人员对图谱的使用难度。
2. HTAP图数据库架构
技术痛点 :传统图数据库事务处理(TP)与分析处理(AP)任务争抢资源,导致查询延迟波动大,复杂计算任务常因资源不足中断。
创新设计:项目采用了一套存储服务、多套计算服务的HTAP架构,避免数据重复的同时,满足了业务层面的API服务、联机查询服务、图计算服务需求(见图2),具有以下特点。
一是存算分离设计。存储层采用分布式分片技术,数据按“实体—关系”分片存储,通过Raft协议保障多副本一致性。二是多引擎物理隔离。部署1套存储集群与3套Quark计算引擎,分别服务API调用(TP)、实时查询(AP)与离线计算任务,CPU与内存资源独立分配,打造了7个节点集群,实现十亿级别的大规模分布式图计算能力,计算性能大幅提升。三是混合查询优化。短路径查询(如一度邻居)由本地引擎多线程执行(延迟<10ms),长路径查询(如六度扩散)通过分布式任务分解,耗时从小时级降至分钟级。四是实测对比。在百亿节点压力测试中,集团客户发现算法性能较Neo4j提升4倍,科创板关联查询效率提高2倍,全量数据导入速度达开源方案的10倍。
应用场景 :从技术突破到业务价值闭环
通过信息技术中心与风控合规投研等业务部门的通力合作,一站式通用智能图谱平台通过构建统一的境内外客户视图、关联风险分析模型、智能合规图谱、政策影响传导模型、科创板关联发现、财务部供应商关联发现应用,显著增强了证券公司在合规管理与风险控制方面的能力,并赋能投研与财富管理领域。项目构建超10个应用场景,有效推动券商数字化和智能化转型,对行业提升风险监测能力、加强业务技术深度融合具有显著的示范效应和推广价值。以下是三大标杆场景的深度解析。
1. 完整的全球客户识别体系 :跨境业务的风控基石
中信证券持续推行国际化战略,是“一带一路”沿线国家和地区拥有最多当地分支机构的中资投资银行。本项目率先在证券行业内构建了较为完整的全球客户识别体系,可有效地控制同一客户识别出现异常变化等数据质量问题,较好地支撑全球化展业和国际化战略(见图3)。
对于风控部门而言,其核心的数据质量要求在于保障客户编号在统一识别过程中具备高度的稳定性与准确性,避免出现过多异常波动或变化。该项目采取了如下手段有效控制数据质量问题,形成高质量数据集,使得客户编号异动的全市场数量占比稳定低于0.008‰。
按照业务需求,进行同一客户数据质量每日检查,持续监控客户数据质量问题并发送邮件给相关数据负责人,同时采用JIRA等工具记录业务提出的数据问题。定期召开数据质量问题会议进行总结分析,找出问题出现的根因,形成质量提升报告,并制订质量提升计划。
持续监控各源头数据的质量,例如监控路透数据源的每日变化,建立历史更名表进行追踪。综合运用路透、LEI、Wind和内部系统等多源数据,进行数据的深度整合并确定融合规则,确保高质量数据字段的优先级。例如,有LEI码的客户,优先用路透的官方英文名称进行修订等。运用NLP等技术,进行相似度匹配,当相似度超过90%且唯一匹配上标准客户库的内容时,则建立内部客户与标准客户的映射。运用图谱交互与融合技术,将业务人员掌握客户的信息与现有图谱进行有效融合,使得客户的识别更加准确与完整。
运用图谱技术,构建含2.3亿实体、4.2亿关系的全球企业关联图谱。采用前缀匹配与相似度算法,结合股权加权路径分析,自动识别控股层级超过12层的复杂集团架构。
项目应用成效,一方面实现BVI企业穿透,认证了数千个集团客户,另一方面服务风险经理,覆盖中信证券的主要境外机构客户。
2. 关联关系发现方案 :关联风险无处遁形
业务需求 :公司各业务部门普遍存在着发现实体(如公司、个人)之间复杂路径的需求,根据关联关系,判断是否符合业务要求或满足准入限制。
技术革新 :一是多层路径分析。支持最多6层的股权/任职关系穿透,自动过滤无效路径(如股权比例不达标)。二是提供动态规则引擎。业务人员可自定义关联类型(如持股超5%、同业竞争等),适应监管规则变化。三是支持一对多的关联查询。突破了传统图算法一对一的局限,大幅提升了查询效率,查询次数从原来的每天近万次降低至了几十次。
应用成效 :关联发现类的多个API累计调用数百万次,覆盖上市公司等各类企业主体、公司客户等,通过及时发现潜在的关联风险,有效降低了业务风险。
3. 政策事件驱动投研方案 :“政策—新闻—产业链知识图谱—个股”影响传导机制
业务挑战 :当前国内基于政策的产业链投研停留在基本面量化上,以研究员人工整理上下游为主,只能给出定性的结果(对应推荐的标的),同时由于大量的人工介入不具备很强的时效性,往往政策发出个股已经有比较强的波动后,才有对应的研究报告。
技术革新 :紧密结合券商核心投研业务,融合先进的智能化投研技术如NLP、知识图谱、图传播、认知推理等,独创性地形成了“政策—新闻—产业链知识图谱—个股”的政策事件驱动投研方案。该解决方案能满足市场参与者对于政策量化分析的需求,填补了行业空白。
应用成效 :基于产业链知识图谱的政策实时推理功能模块,可以在数秒内完成政策的实时推理,得到行业板块和个股的影响因子,简化了繁琐的人工流程,较好地辅助投研业务。
经过回测,由受政策正向联动个股形成的投资组合在2022年相对沪深300指数的超额收益为25.36%,根据因子选取的行业投资组合在2018—2022年相对中信证券一级行业等权配置组合年化超额收益为14.16%。
价值实现 :经济效能与行业引领并举
数据治理效率提升30%,涉及规模以上客户的风险预警报告产出百余份,覆盖数千家A股上市公司及战略配售、融资融券投资人,构建的投资组合在2022年相对沪深300指数的超额收益为25.36%,该回测效果论证了策略的有效性。
该项目荣获中国人民银行金融科技发展奖一等奖、中信集团科学技术奖一等奖等10余个奖项,获发明专利授权6项、软件著作权5项,发表论文6篇。目前中信证券正在牵头制定图数据库团体标准《证券行业图数据库系统技术与功能标准》,旨在共同规范并推动证券行业图数据库与知识图谱技术发展。
结语
中信证券一站式通用智能图谱平台的落地,不仅是技术工具的升级,更实现了风险管理从“事后响应”到“事前防控”的范式跃迁。通过将复杂的关联关系转化为可视化的知识网络,将人工经验沉淀为可复用的算法模型,一站式通用智能图谱平台正在重新定义证券行业的风险治理和数智化赋能业务边界。未来,中信证券将持续探索技术与业务的深度融合,为行业高质量发展注入强劲动能。
(此文刊发于《金融电子化》2025年4月下半月刊)