财源主题库系统


统一的税源信息主题库包括原始涉税信息库和主题涉税信息库。原始涉税信息库,是各单位交换来的涉税数据通过关联、比对形成,建立全市信息数据库备案、注册、运行、更新、注销管理制度,实现全市信息数据库的动态管理和统一共享,促进信息资源的网络化,将获取的结构化、半结构化及非结构数据统一表示为可接受的特定标准格式,并通过多模式映射,实现不同单位、部门提供的异构数据语法、语义的一致。

针对第三方数据不规范,采用智能匹配方法解决数据关联问题。数据质量检测应记录ETL过程中的错误信息。具体包括错误代码、错误名称、对应部门、错误数等。

        税源信息主题库(数据仓库),是在原始涉税信息库基础上,按照面向税源监管分析要求,通过抽取、清洗、加工、转换、映射、汇总、聚集、装载等技术手段,构建综合治税分析的数据仓库,为综合治税应用提供分析服务。包括:市场主体库、自然人库、项目库、人口库和社保库等。