报告题目:从大数据治理到大数据清洗
报告时间:2019年11月9日 下午14:00
报告地点:计算机A521
报告人:王宏志
报告人简介:
王宏志,哈尔滨工业大学计算机科学与技术学院教授、博士生导师,美国加州大学欧文分校博士后,微软亚洲研究院铸星计划访问学者,青年龙江学者。其研究方向为大数据、数据科学、数据管理与分析。在VLDB, SIGMOD等国内外重要会议和期刊发表学术论文百余篇,出版学术专著两本, 其论文被SCI收录60余次,他引千余次。获得微软学者、中国优秀数据库工程师、IBM博士英才等称号,获得黑龙江省自然科学一等奖和教育部高等学校科技进步一等奖各一项,获黑龙江省青年科技奖、宝钢优秀教师奖、CSC-IBM奖教金。先后主持国家自然科学基金重点项目、国家支撑计划课题、国家博士后特别资助等10余个项目。中国计算机学会杰出会员,任中国计算机学会哈尔滨分部副主席、ACM SIGMOD中国秘书长,中国计算机学会学术工作委员会委员、CCF YOCSEF哈尔滨分论坛荣誉委员、中国数据库专业委员会常务委员、中国大数据专家委员会委员、中国计算机应用专业委员会委员、ACM数据科学学科标准编写组专家。
报告内容简介:
数据治理是大数据得以有效应用的重要环节,在数据治理中,数据质量是最受关注的重点之一。由于其特点,大数据中有更大可能包含各种类型的数据质量问题,这些数据质量问题为大数据的应用带来了困扰,甚至灾难性后果。对大数据进行清洗是解决大数据的质量问题重要途径,然而,大数据为数据清洗技术提出了模态多样、错误共生和数据高熵等挑战问题。本报告介绍了这些挑战问题,并针对这些挑战问题介绍了在大数据清洗方面的探索与实践,讨论应对这些挑战的相关理论与技术。
主办单位:
吉林大学计算机科学与技术学院
吉林大学软件学院
吉林大学计算机科学技术研究所
符号计算与知识工程教育部重点实验室
吉林大学国家级计算机实验教学示范中心
吉林省大数据智能计算重点实验室