东谈主民网北京1月3日电 (记者许维娜)记者从国度数据局了解到,为凝华等闲共鸣,推动数据界限相干学问的表率普及,数据界限名词讲解注解草拟巨匠组日前发布《数据界限常用名词讲解注解(第一批)》,该批名词讲解注解涵盖了数据相干基本主张、数据存储与分析相干时间、数据安全与阴私保护等多个重要术语,旨在为社会各界提供融合、泰斗的参考模范。 附:数据界限常用名词讲解注解(第一批) 1.数据,是指任缘何电子或其他神态对信息的记载。数据在不同视角下被称为原始数据、繁衍数据、数据资源、数据居品和劳动、数据财富、数据身分等。 2.原始数据,是指首次产生或泉源网罗的、未经加工处理的数据。 3.数据资源,是指具有价值创造后劲的数据的总称,频繁指以电子化样式记载和保存、可机器读取、可供社会化再诓骗的数据聚合。 4.数据身分,是指参加到分娩运筹帷幄步履、参与价值创造的数据资源。 5.数据居品和劳动,是指基于数据加工酿成的,可餍足特定需求的数据加工品和数据劳动。 6.数据财富,是指特定主体正当领有或者终局的,能进行货币计量的,且能带来经济利益或社会效益的数据资源。 7.数据身分阛阓化设立,是指通过阛阓机制来设立数据这一新式分娩身分,旨在建立一个愈加灵通、安全和高效的数据流畅环境,不休开释数据身分价值。 8.数据处理,包括数据的网罗、存储、使用、加工、传输、提供、公开等。 9.数据处理者,是指在数据处理步履中自主决定处理目的和处理神态的个东谈主或者组织。 10.受托数据处理者,是指选择他东谈主交付处理数据的个东谈主或者组织。 11.数据流畅,是指数据在不同主体之间流动的过程,包括数据灵通、分享、交往、交换等。 12.数据交往,是指数据供方和需方之间进行的,以特定样式数据为目的,以货币或者其他等价物算作对价的交往步履。 13.数据治理,是指擢升数据的质料、安全、合规性,推动数据灵验诓骗的过程,包含组织数据治理、行业数据治理、社会数据治理等。 14.数据安全,是指通过遴荐必要方法,确保数据处于灵验保护和正当诓骗的景象,以及具备保险捏续安全景象的才气。 15.群众数据,是指各级党政机关、企业绩单元照章履职或提供群众劳动过程中产生的数据。 16.数字产业化,是指出动通讯、东谈主工智能等数字时间向数字居品、数字劳动搬动,数据向资源、身分搬动,酿成数字新产业、新业态、新模式的过程。 17.产业数字化,是指传统的农业、工业、处业绩等产业通过应用数字时间、采集交融数据、挖掘数据资源价值,擢升业务脱手成果,镌汰分娩运筹帷幄资本,进而重构想维默契,举座性重塑组织照顾模式,系统性变革分娩运营经由,不休擢升全身分分娩率的过程。 18.数字经济高质料发展,是指围绕加速栽种新质分娩力,以数据身分阛阓化设立检阅为干线,通过协同完善数据基础轨制和数字基础设施、全面股东数字时间和实体经济深度交融、捏续擢升数字经济治理才气和外洋合作水平,终局作念强作念优作念大目的的数字经济发展新阶段。 19.数字耗尽,是指数字时间、应用支捏酿成的耗尽步履和耗尽神态,既包括对数智化时间、居品和劳动的耗尽,也包括耗尽实践、耗尽渠谈、耗尽环境的数字化与智能化,还包括线上线下深度交融的耗尽新模式。 20.产业互联网,是指诓骗数字时间、数据身分推动全产业链数据融通,赋能产业数字化、鸠合化、智能化发展,推动业务经由、组织架构、分娩神态等重组变革,终局产业链高卑劣协同转型、线上线下交融发展、全产业降本增效与高质料发展,进而酿成新的产业相助、资源设立和价值创造体系。 21.城市全域数字化转型,是指城市以全面真切数据融通和开垦诓骗为干线,综合诓骗数字时间和轨制蜕变器具,终局时间架构重塑、城市照顾经由变革和产城深度交融,促进数字化转型全界限增效、支捏才气全处所增强、转型生态全过程优化的城市高质料发展新模式。 22.“东数西算”工程,是把东部地区经济步履产生的数据和需求放到西部地区狡计和处理,对数据中心在布局、鸠合、电力、能耗、算力、数据等方面进行统筹狡计的首要工程,比如东谈主工智能模子锤真金不怕火推理、机器学习等业务场景,不错通过“东数西算”的神态让东部业务向西部表象水电丰富的区域迁徙,终局东西部协同发展。加速推动“东数西算”工程建立,将灵验激勉数据身分蜕变活力,加速数字产业化和产业数字化程度,催生新时间、新产业、新业态、新模式,支捏经济高质料发展。 23.高速数据网,是指面向数据流畅诓骗场景,依托鸠合编造化、软件界说鸠合(SDN)等时间,提供弹性带宽、安全可靠、传输高效的数据传输劳动。 24.宇宙一体化算力网,是指以信息鸠合时间为载体,促进宇宙范围内种种算力资源高比例、大范围一体化调养运营的数字基础设施。算作“东数西算”工程的2.0版块,具有集约化、一体化、协同化、价值化四个典型特征。 25.元数据,是界说和刻画特定数据的数据,它提供了对于数据的结构、特征和关系的信息,有助于组织、查找、会通、照顾数据。 26.结构化数据,是指一种数据暗示样式,按此种样式,由数据元素汇集而成的每个记载的结构齐是一致的,况且不错使用关系模子给以灵验刻画。 27.半结构化数据,是指不合乎关系型数据库或其他数据表的样式关联起来的数据模子结构,但包含相干象征,用来分隔语义元素以及对记载和字段进行分层的一种数据化结构样式。 28.非结构化数据,是指不具有预界说模子或未以预界说神态组织的数据。 29.数据分析,是指通过特定的时间和方法,对数据进行整理、斟酌、推理和轮廓回首,从数据中索要有用信息、发现功令、酿成论断的过程。 30.数据挖掘,是数据分析的一种技巧,是通过统计分析、机器学习、模式识别、巨匠系统等时间,挖掘出粉饰在数据中的信息或者价值的过程。 成人男同31.数据可视化,是指通过统计图表、图形、舆图等图形化技巧,将数据中包含的有用信息明晰灵验地传达出来,以便于数据使用者更好地会通和分析数据。 32.数据仓库,是指在数据准备之后用于遥远性存储数据的数据库。 33.数据湖,是指一种高度可扩张的数据存储架构,它迥殊用于存储广博原始数据和繁衍数据,这些数据不错来自多样起原并以不同的样式存在,包括结构化、半结构化和非结构化数据。 34.湖仓一体,是指一种新式的灵通式的存储架构,买通了数据仓库和数据湖,将数据仓库的高性能及照顾才气与数据湖的活泼性交融起来,底层支捏多种数据类型并存,能终局数据间的互相分享,表层不错通过融合封装的接口进行探询,可同期支捏及时查询和分析。 35.阴私保护狡计,是指在保证数据提供方不暴露原始数据的前提下,对数据进行分析狡计的一类信息时间,保险数据在产生、存储、狡计、应用、放荡等数据流转全过程的各个要领中“可用不可见”。阴私保护狡计的常用时间决策有安全多方狡计、联邦学习、委果实行环境、密态狡计等。常用的底层时间有混浊电路、不经意传输、精巧分享、同态加密等。 36.安全多方狡计,是指在一个差别式鸠合中,多个参与实体各自捏有精巧数据,各方但愿以这些数据为输入共同完成对某函数的狡计,而条目每个参与实体除狡计驱逐、预期可公开的信息外均不行得回其他参与实体的任何输入信息。主要斟酌针对无委果第三方情况下,安全地进行多方协同的狡计问题。 37.联邦学习,是指一种多个参与方在保证各自原始独到数据不出数据方界说的委果域的前提下,以保护阴私数据的神态交换中间狡计驱逐,从而相助完成某项机器学习任务的模式。 38.委果实行环境,是指基于硬件级烦嚣及安全启动机制,为确保安全明锐应用相干数据和代码的精巧性、无缺性、委果性和不可否定性目的构建的一种软件脱手环境。 39.密态狡计,是指通过综合诓骗密码学、委果硬件和系统安全相干时间,终局狡计过程数据可用不可见,狡计驱逐省略保捏密态化,以支捏构建复杂组总狡计,终局狡计全链路保险,小心数据泄漏和浮滥。 40.区块链,是差别式鸠合、加密时间、智能合约等多种时间集成的新式数据库软件吉吉影音播放,具有多中心化、共鸣委果、不可点窜、可追思等特点,主要用于搞定数据流畅过程中的信任和安全问题。 |