您现在的位置:首页>审计之窗>审计论坛
浅谈大数据审计中的数据处理
信息来源:公安县审计局 | 发布时间:2019-05-10

 

随着大数据技术的发展,面对被审计单位海量的业务数据,运用大数据技术来进行审计是顺应时代发展的必然手段。审计人员可以利用大数据综合分析来提炼有用信息,为审计提供更多的思路和方向,而数据处理则是审计人员分析的前提,有着至关重要的作用。笔者主要从原因、方式等方面浅显探讨。

一、大数据审计中的数据处理原因

一是数据的不完整导致数据分析工作滞后。被审计单位的数据往往是满足其自身管理经济业务的需要,所以,该单位的操作人员在录入数据时,存在不完整录入、不规范录入、错误录入等现象,这就限制了审计人员按照这一数据值的某一特效进行分析。

二是值域定义的不完整影响数据的准确性。被审计单位的数据如果没有对某些数据的格式进行正确的约束,往往造成操作人员在录入数据时将某一数据录入后变成了其他数据。例如,编号为“011113”的文本数据,在录入到数字类型的文本框时,会变成“11113”,将身份证为“421022********0011”的文本数值直接复制粘贴到excel表中时,会变成“421022********0000”。

三是大量冗余数据降低数据分析的效率性。被审计单位的数据存在大量没有使用或存储辅助信息的字段和记录,这些对于审计人员来说没有任何作用,审计人员在分析数据时可能因过多的数据量影响思维、扰乱思路、浪费时间,大大降低数据分析的效率性。

二、大数据审计中的数据处理方式

一是使用Excel表格处理。对于数据量较小的被审计单位,通常是以Excel表来存储数据。Excel不仅提供了数据的排序、筛选、汇总等实用的操作功能,还可以很直观进行增加、修改、删除数据记录。审计人员也可以直接进行复制、粘贴等便捷操作,或手工填充数据来完成数据的处理工作,达到简单、省时、省力的效果。

二是使用SQL语言处理。对于数据量较大的被审计单位(例如医院、学校等),不管是以SQL数据库方式存储,还是以ORACLE数据库方式存储,都可以将关键表提取后,导入到SQL数据库中,利用SQL语言来实现相关的数据处理。SQL语言集数据查询、数据操纵、数据定义、数据控制四大功能于一,不仅可以使审计人员在进行数据处理的过程中能清楚掌握数据的实时状况,及时发现和纠正问题,还可以通过sql命令来对已有的思路进行查询分析,达到简化操作、节约时间、提高效率的效果。

三是使用审计软件等三方软件处理。在数据处理时,审计人员还可以根据数据的具体格式,利用审计署开发的审计软件或其他数据库。例如审计软件的“数据维护”功能可以对数据进行简单的处理,数据格式为(.mdb)Access文件的,可以通过“更新查询”或更改表结构来实现,数据为TXT、ASD等文件的,可以通过“txt”文本框打开后实现简易处理。

四是通过新形势的技术手段处理。新形势的技术手段通常有规则库模块检索、公共字段或属性匹配、孤立点检测算法、数据挖掘技术类聚功能等,都能实现对大数据审计中的数据处理。(关可浩)


打印|关闭