来源:《中国高新技术产业导报》
北京是中国软件产业的中心,产业规模居全国首位。尽管如此,北京的数据挖掘产业发展与中国数据产业类似,仍停留在初级阶段。北京拥有大量从事数据挖掘的国内外企业和单位,分布在理论算法研究、软件工具、咨询服务、集成开发等产业链各个环节。相比较而言,产业链上游市场主要被国外企业占据,国内企业主要处于产业链的末端。SAS、SPSS、SAP、Oracle、Teredata、微软和IBM等企业都把北京作为辐射中国的核心;而国内企业像神州数码、太极、中科软、华迪、拓尔思等主要提供系统集成服务,产品和工具提供商数量较少,规模较小,影响力与国外企业相比有一定差距。
北京海量数据挖掘产业发展难点分析
用户数据挖掘工具使用能力弱
目前用户普遍存在的问题是,数据掌握者与数据挖掘结果需求者往往不是同一人,由此造成掌握企业数据的人不知道数据有什么用,而需要数据挖掘结果的人却不知道从何处得到这些结果,因而在决策中处于被动的局面。用户数据挖掘工具使用能力弱,造成企业数据与数据挖掘结果的集成问题突出。
用户缺乏能够执行数据挖掘的复合型人才
从目前电信、金融行业的人才结构来看,主导建设数据挖掘系统的大多是工科出身,业务不熟悉,对于数学领域中的统计学也都较为生疏。因此这种复合型人才的缺乏也在很大程度上造成了我国数据挖掘市场的不成熟。
数据源的可靠性问题
数据源是整个数据挖掘过程的源头,如果源头的数据不能保证可靠、可信和科学,那么挖掘得到的信息也就不可靠。因此,如果数据源的问题不解决,数据挖掘就是纸上谈兵。
北京发展海量数据挖掘产业的优劣势分析
北京发展海量数据挖掘产业的优势
一是数据挖掘产业结构完整。完整的数据挖掘产业链条包括算法提供方、产品和工具提供商、系统集成商、咨询公司和企业用户。北京是中国软件产业的中心,其海量数据挖掘产业结构相对完整。
二是有较为成熟的理论和技术。北京有较为成熟的海量数据挖掘理论和技术,拥有北大SAS 数据挖掘卓越中心、中国科大博纳数据挖掘中心等专业研究机构;拥有中科院计算所MSMiner多策略数据挖掘平台、人大金仓SmartBI系列产品、TRS BigData等海量数据挖掘产业有代表性的产品。
三是数据资源丰富,企业、政务机关集聚,数据的质量和数量都占有优势。