图片报道

Video

  • McKesson|Randy Spratt

    11-09
  • McKesson是美国历史最悠久、规模最庞大的一家医药卫生公司。McKesson公司CIO Randy Spratt讲述了是什么力量驱动公司进行改革,是哪些服务和产品关系到医疗卫生的方方面面。

热门讨论

工具

您的位置:行业>政府

税务数据利用存在九大风险


更新时间:2007-06-20 作者:非语 关键字:税务数据  

方案检索:




cweek.com.cn欢迎您

经过税务信息化十多年的发展,不少税务部门积累了大量宝贵的数据资源,各地也陆续开展了数据资源利用的项目建设。但是我们应当看到,数据利用、特别是数据的深度利用作为高层的信息化应用,除了给我们带来极大的管理水平提升之外,也存在着较大实施和应用风险,利用不善也会带来严重问题。税务部门在实施数据利用项目时,要充分认识到数据利用的难点,预先防范、及时补救,才能降低数据风险,提高数据利用的效果。

数据利用存在的潜在风险可以概括为9个方面:

一是数据来源的一致性。数据利用的原始数据可能在多个数据源头中存在,例如税户的基本信息可能同时存在于综合征管系统、出口退税系统中,这两个系统的税户信息就可能存在不一致。如果不同的税户数据分析分别来自于这两个系统,得到的结果就会不同。

二是原始数据的积累度。数据分析往往需要累积到一段较长时间内的分析主体数据才可以开展。特别是基于时间的趋势和行为变化的分析任务,没有一个较长时间的数据积累,根本不可能得出有用的分析结论。

三是原始数据的全面性。数据分析不仅需要长期的数据积累,也需要多方面采集分析主体的全面数据。一个纳税人的税务数据可能涉及到基本信息、征管数据、发票数据以及财务信息、资产数据等。纳税人的行为分析需要对其各方面情况进行全面综合分析,片面的数据来源可能导致片面的分析结果。

四是原始数据的准确性。据统计,一个熟练打字员的录入错误率在2%左右。数据录入中的人为错误不可避免,此外,程序的逻辑错误也可能造成原始数据的错误。基于错误原始数据的数据利用不可能得出正确的分析结果,数据利用之前必须考虑数据的正确性审计和校验。

五是数据处理转换的失真。从原始数据到展现在最终用户前的分析结果,在整个数据流动增值的过程中,会经过多道抽取加工、清洗转换的过程。越复杂,数据利用加工的深度越深,数据失真的风险越大。

六是数据算法模型的适用性。同样的原始数据采用不同的算法分析会得出不同的结果,前述的房产分析结果的差异就是因为采用了不同的分析模型,一个使用了采样分析法而另一个使用了平均值分析。在数据利用中需要选择最适合应用情况的模型算法。

七是数据利用结果的展现。国内的各级用户都习惯于复杂的报表,在一张报表上容纳了大量的信息,国外的报表相对简单,数据展现常用的国外报表工具经常不能适应国内的要求,需要二次开发和转换,使得项目的开发实施难度加大。

八是最终用户的培训。数据利用类型的应用对使用者的要求较高。比起普通应用,需要用户有较高的参与度和一定的数据分析能力,对数据分析的对象和目标有一定程度认识,这也是为什么不少数据的利用和应用叫好不叫座的原因。

九是数据安全保密控制。税务部门作为国家机关,不少数据涉及保密要求,即使是普通纳税人的数据也有代为保密的要求。对于原始数据的安全保密大家都有着普遍的认识,对于数据分析的结果也需要引起重视。