数据视觉化源于20世纪50年代的计算机图形学,计算机第一次根据数据生成了图形和图像。该学科的兴起,始于1987年美国国家科学基金会的学术报告“科学计算的可视化”,作者是 Bruce H. McCormick, Thomas A. DeFanti 和 Maxine D. Brown。在这篇报告中强调了对“以新兴计算机技术为基础的视觉化手段”的需求。随着计算机性能的不断提高,建立更加庞大和复杂的数据模型成为可能,从而催生出了各种海量数据。此外,一些新兴的数据采集设备也产生了各种海量数据,如医用扫描仪,电子显微镜,这些数据以文字,数字及各种媒体形式保存起来。此时,非常需要应用先进的计算机图形技术来处理和可视化这些海量数据。
“科学计算可视化”即后来的“科学视觉化”,最初仅指科学计算过程中的一部分,例如计算机建模中显示的模型,机械模拟中的仿真环境。在商业、财务、管理和数字媒体等领域出现了各种海量数据,数据可视化也正日益被这些领域所关注。20世纪90年代初产生一项名为信息视觉化的新兴研究,为不同应用领域中的海量信息处理提供支持。因此, “数据可视化”一词同时被科学领域和信息视觉化领域所接受。
自此,数据视觉化作为一个不断发展的概念,其影响范围不断扩大,因此对它的定义最好是相对灵活的广义界定。数据视觉化指的是一种先进的技术,利用图形学,图像处理,计算机视觉,用户界面等方式,通过表达,模型,物理展示,界面交互,动画等形式视觉化的解释数据。
目前,学术界对数据视觉化应用范围的划分存在不同的版本,但都有一个共同的重点——信息表达。例如,Michael Friendly (2008)将数据视觉化的应用领范围分为:统计性图表和主题性制图。又例如,Data Visualization: Modern Approaches(2007)一文中给出了数据视觉化的七个应用范围:
思维导图新闻类信息传达数据类信息传达关系类信息传达网站的信息传达文本类信息表达工具说明和服务说明 所有这些主题都与图形设计和信息表达紧密相关。
另一方面,从计算机科学的角度看Frits H. Post (2002)对数据可视化进一步细分,划分了若干个子领域:
可视化算法与技术立体可视化信息可视化多分辨方法建模技术交互技术和信息架构 数据视觉化的成功兴起首先归因于其稳固的核心思想:利用计算机生成的图像,以深入了解数据的模式结构和逻辑关系。其次,人类视觉感知系统不仅广泛渗透在指导和解释各类复杂对象的过程中,而且在模拟和采集来自不同科学领域中的海量数据中也发挥着关键作用。因此,数据视觉化对于计算机科学领域、管理领域、行政领域等涉及海量数据的领域显得格外重要,并且将在未来发挥更加广泛的影响。
数据采集是指从现实世界中采样数据,这个可以由计算机来操作。有时缩写DAQ或DAS。数据采集通常包括:获取信号、生成波形、通过处理信号以获得所需的信息。完整的数据采集系统还包括适宜的传感器,把测量到的数据转换成电信号,这是数据采集所需的硬件条件。
数据分析 数据分析是寻找和总结数据,提炼有用信息,推导结论的过程。数据分析与数据挖掘关系紧密,但是数据挖掘主要注重的是更大量的数据,较少着眼于结论推导。在统计应用领域,有些人把数据分析分为描述统计学,探索性因子分析和验证性因子分析。探索性因子分析(EDA)主要着眼于发现数据中的新特点;验证性因子分析(CDA)则侧重于论证假设。 数据分析的类型: 探索性因子分析(EDA):一种对数据概况不清时的假设分析,是对于假设测试的常规统计手段。由John Tukey命名。 定性数据分析( QDA )或定性研究:是指对非数字数据进行分析,例如文字,照片等。
数据规划指机构所具有的完善、稳定的数据理念,以及建立过程中涉及到的人力、流程、相关技术手段。 通过建立良好的数据规划可以: 提高决策效率,增强决策信心 减少决策风险 提高数据安全性 最大限度地挖掘数据潜力 保证信息的质量
是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程。其目的在于充分有效地发挥数据的作用。实现数据有效管理的关键是数据组织。随着计算机技术的发展,数据管理经历了人工管理、文件系统、数据库系统三个发展阶段。在数据库系统中所建立的数据结构,更充分地描 述了数据间的内在联系,便于数据修改、更新与扩充,同时保证了数据的独立性、可靠性、安全性与完整性,减少了数据冗余,提高了数据共享程度及数据管理效率。
指从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。它已经被广泛的应用于金融行业和财务分析中,现在在科学领域的数据分析中也使用的越来越多。 数据挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信息库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘,又称为数据库中知识发现(Knowledge Discovery in Database, KDD), 也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程由以下步骤组成:
数据清理数据集成数据选择数据变换数据挖掘模式评估知识表示
数据建模指的是对各类数据的抽象组织,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。 将经过系统分析后抽象出来的概念模型转化为物理模型后,在visio或erwin等工具建立数据库实体以及各实体之间关系的过程。
建模过程中的主要活动包括:
确定数据及其相关过程(如实地销售人员需要查看在线产品目录并提交新客户订单)。定义数据(如数据类型、大小和默认值)。确保数据的完整性(使用业务规则和验证检查)。定义操作过程(如安全检查和备份)。选择数据存储技术(如关系、分层或索引存储技术)。
相关知识
【叶片病虫害数据集】果树叶片病变识别 机器视觉 Python (含数据集)
科学认识和有序推进数据资产化
全球进入数据化
视觉化新技术显示花与水分的关系—新闻—科学网
【中国科学报】视觉化新技术显示花与水分的关系
【果树林木病虫害数据集】 果树病虫害检测 林木叶片病虫害识别 计算机视觉(含数据集)
林业技术的数据化与智能化.pptx
植保信息化:病虫害防治数据化管理
数据化管理在餐饮业中的应用
【水果数据集】水果品种识别 人工智能 机器学习(含数据集)
网址: 数据视觉化 https://m.huajiangbk.com/newsview1545179.html
上一篇: 数据化妆师:AI如何美化报告的视 |
下一篇: 数据洞察:视觉化引领 |