采购范围:
1、项目研究内容
(1)关键技术研究
分词技术
分词技术就是针对用户提交查询的关键词串进行的查询处理后根据用户的关键词串用各种匹配方法进行分词的一种技术。所谓分词就是把字与字连在一起的汉语句子分成若干个相互独立、完整、正确的单词,词是最小的、能独立活动的、有意义的语言成分。
非结构数据解析
非结构化解析引擎现在己经实现了从非结构化文档中采集关键信息的功能,但针对不同格式的文档,所用的具体技术不尽相同。基于POI函式库,它提供的API给能够支持程序对Microsoft Office、WPS、PDF等各种格式文档进行读和写的功能,从文档中读取出需要的信息,在本项目中,可结合分词处理技术,提取业务数据的关键信息,作为创建数据模型的基础数据。
(2)收集内控相关业务信息,建立业务数据仓储
收集众多业务数据,通过分词技术、非结构化数据解析等技术进行业务提取、预处理,将内控相关业务数据进行整合合并,创建业务数据仓储,为后期业务模型创建打下良好基础。
(3)业务分析建模
通过创建的业务数据仓储,对业务数据进行分析,根据不同业务场景,进行业务建模,满足不同业务场景的业务判断。对当前业务进行测评时,能够通过创建的业务模型,对数据进行分析,自动将不合规的业务数据样本抽取,引入到测评工作中。
2、项目提供的最终成果
(1)研究基于自然语言理解、非结构化数据的语义解析技术(包括分词、非结构化数据解析等),进行数据提取,提取业务数据的关键信息,出具《关键业务数据提取结果报告》;
(2)收集众多业务数据,通过分词技术、非结构化数据解析等技术进行业务提取、预处理,将内控相关业务数据进行整合合并,创建数据库形式的业务数据仓储;
(3)通过创建的业务数据仓储,对业务数据进行分析,根据不同业务场景,进行业务建模,满足不同业务场景的业务判断。本期项目预计形成2个关键领域业务模型;
(4)对当前业务进行测评,通过创建的业务模型,对数据进行分析,自动将不合规的业务数据样本抽取,引入到测评工作中。形成《业务验证报告》。
3、项目成果交付形式:
(1)技术研究报告、业务研究报告 各1项 ;
(2)程序DEMO 1项目;
(3)项目形成的核心期刊论文 1篇;
(4)项目形成的专利1项(进入实审阶段)。
(二)项目概述:
大数据是当今科技创新领域内最热门的话题之一,大数据是无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。因此大数据技术可以减少因人为因素主动规避不合规,同时能更全面地对信息数据进行自动判断,减少随机抽样带来的不合规信息遗漏。
本项目研究运用大数据、非结构化数据解析、分词引擎等技术,根据内控测评所需要的样本要求,研究解决业务数据和财务数据的自动抽样问题,通过扩大样本范围,提高内控测评的覆盖度,避免人为抽样带来的遗漏风险。通过对结构化及非结构化业务数据的收集、解析和预处理,结合内控业务检查要求和控制标准,研究创建合理的分析模型,对业务数据样本进行自动检查,验证业务数据和财务数据、业务与关联业务等之间的信息正确性,同时识别出不合规样本,辅助测评,并逐步完善内控体系的风险控制矩阵,拟提升内控测评的效率和效果,支持企业决策、管理、执行层级的全面性,促进企业经营的改善,实现了企业经营目标最大化。
三、投标人资格要求
本项目不接受联合体投标。
通用资格:
通用资格要求
序号
内容
1
具有独立法人资格且为中华人民共和国境内注册的法人,持有合法有效的企业法人营业执照、组织机构代码证、税务登记证或有工商行政管理部门核发统一社会信用代码的企业法人营业执照;
2
具有良好的商业信誉和健全的财务会计制度,提供近三年经审计的财务报告(新成立公司按公司成立时间提供),没有处于被责令停业或破产状态,且资产未被重组、接管和冻结;
3
在经营活动中无重大违法记录,在 范围内没有处于限制投标资格的处罚;
4
同一法人的企业或有隶属关系(母公司、全资子公司及其控股公司)的企业,只允许一家参与本次投标,否则均按资格审查未通过处理。
5
不接受联合体投标,不允许分包。
专用资格:
专用资格要求
序号
内容
关联标的/标包
1
具有同类大数据分析模型研究项目业绩;
基于大数据的内控业务分析模型的研究
四、招标文件的获取
本项目招标人通过 电子商务系统(登录网
八、监督部门
本招标项目的监督部门为:投标人和其他利害关系人认为本次招标活动违反法律、法规和规章规定的,有权向有关行政监督部门投诉。监督投诉机构名称:中国 监察局; 监督投诉机构
九、
电
项目联系人:李杨 联系电话:010-51957458 传真:010-51957412 手机:13683233285 QQ:1211306049 微信:Li13683233285 邮箱:1211306049@qq.com csg