城市专区渴望城市在线观看城市水资源排名十大资源型城市
开放数据中国从2012年起一直致力于倡导和推动数据开放的工作
开放数据中国从2012年起一直致力于倡导和推动数据开放的工作。虽然近年整体国内的数据开放政策建设和数据门户建设正日益增长,但实践上,我们显然还有着诸多的挑战。
2018年,我们曾受托开展了一项关于未来城市数据开放运营体系指标的研究。而站在2023年,回看当初的研究,我们发现其仍未过时,甚至还有大量的内容至今尚未实现。因此十大资源型城市,这个新系列里我们想把我们的研究成果予以分享,希望对更为广泛的数据开放实践和研究能够有所参考和启发。
数据门户(Data Portal)是任何开放数据计划启动时就会率先纳入建设计划的信息系统,其作为集中式的一站式门户提供对开放数据范畴内的数据的集中索引,并面向终端用户提供搜索、访问、获取、预览数据资源的支持,以及作为在线渠道支撑数据使用者和数据发布者的交互例如数据评价、数据反馈等。
在很长一段时间内,「建设开放数据计划」就近乎等同于「要开发上线一个数据门户」,数据门户成为了开放数据工作具象化的手段与成果展示。但正如我们在前文中已经提及的,当开放数据所覆盖的数据类型发生变化,从政府数据逐步扩展至城市数据,其对应的数据发布主体类型也发生根本的变化,而最终随着数据发布主体的多元城市专区,开放数据工作的治理将更多去中心化,数据的发布自然也将更为去中心化,在这样的情况下,我们是否还一定需要集中式的通过一站式的门户去发布数据?而进一步,考虑到数据的流通权限渴望城市在线观看、流通监管将成为未来的重点治理方向,我们需要的还仅仅是一个辅助数据发布、索引及获取的门户网站吗?还是说,从治理主体角度(政府)而言,为了更好促进和治理整个城市的数据开放流通,我们需要加大投入的是基础设施,一组信息技术系统用于支撑数据开放流通中从发布到授权到监管的全生命周期的管理,而非仅仅是一个面向终端使用者的信息服务网站?
在本章节中,我们带着上述的问题,结合欧美国家对于数据门户的反思,以及整体万维网及人-数(Human-Data)交互的技术趋势,来对数据平台的建设运营指出未来的可能方向。
数据平台的发展趋势可以从两个角度予以解构,一是从服务数据发布者的角度,一是从服务数据使用者的角度。我们首先从服务数据发布者的角度来剖析变化趋势:
首先我们观察到的一个趋势是,随着数据范畴从政府数据扩展到公共数据直至城市数据,对于数据发布的主体而言,其愿意通过统一的由政府建设的数据门户上传或提供数据接口的意愿是不一致的。从品牌角度考量城市专区,企业往往期望能够建设自身品牌的数据发布门户,而这实质性引导了数据从中心化的统一门户发布变化成了去中心化的多渠道发布数据。对于城市数据平台而言城市水资源排名,其面向数据发布者的功能发展方向则从单纯的支撑发布者统一通过城市数据平台发布数据,并上架索引支持发现搜寻数据,进而变化到应当能够主动识别城市数据范畴内的数据发布者,建立机制主动发现或被动提醒去中心化发布的数据资源城市专区,并在城市数据平台索引相关资源,提供正确的指向数据资源的链接,并能够定期予以活性的检查。
而随着去中心化发布的到来,另一个显著的变化则是城市数据平台将更注重城市数据资源的监管和跟踪,而不仅仅是发布(而且事实上发布这件事商业平台可能做得比城市平台更好)。传统中心化发布的场景下,数据开放的生命周期:从发布,到被发现,到被获取,到被应用,基本能够通过城市数据平台予以追踪。而在去中心化的场景中,城市数据平台仅仅起到「指路人」的作用:导引用户通过城市数据平台到达发布在数据拥有者自有渠道的数据渴望城市在线观看,其被获取、被应用的情况则由数据拥有着自行管理。因此,对于城市数据平台而言,应当建立起机制,能够和数据发布者建立起通讯方式,实时或定期掌握数据的流通情况和应用情况,从而从宏观上而言,一个城市的城市数据平台应当掌握整个城市的数据脉络。
从2.1和2.2的变化趋势中我们不难看出,去中心化的数据流通会为扮演中心化角色的城市数据平台带来诸多的挑战。而从解决的思路上来看,将城市数据平台不再简单定义为一个在线的应用网站系统,而是将其视为网站加上一组支撑网站功能的必要技术基础设施则是更为合理的架构视角。事实上城市专区,这意味着城市数据平台不单单应当作为数据开放流通的前沿阵地,其本身应当成为一组开放的技术组件供他人复用。如果其本身作为基础设施,能够被数据发布者复用,则数据发布的流程、标准等将一并复用而方便管理,如果其本身的数据权限、用户账号等组件能够作为基础设施被应用整合于第三方数据发布者自身开放发布系统的建设,则城市数据平台本身将更好地被整合入整个城市的数据生命周期中。
对于目前的开放数据门户设计,大多数情况下为了帮助用户检索和发现门户数据,提供的功能有:搜索框、按数据管理类元数据所设计的筛选器和按单个数据的统计量的推荐。
功能功能描述限制搜索框一般通过数据集的标题、简介的文字做精准或模糊的文本搜索。较少支持针对数据字段及数据内容的搜索,亦无法根据语义搜索相应内容按数据管理类元数据所涉及的筛选器筛选器即一般提供的「按机构」、「按主题」等下拉、勾选式的筛选工具,用于对整体数据集或现有搜索结果做进一步过滤。目前数据门户通常按照数据自身的管理类元数据即其主题、发布单位、发布日期、数据格式等信息设计筛选器。较少围绕其结构类元数据即数据范式(字段)或描述类元数据(即使用情境、采集背景、原始用途等)做筛选,限制了数据从应用角度的发现可能按单个数据的统计量的推荐按单个数据集的「下载量」、「浏览量」等统计量设定的推荐排行榜下载量、浏览量等方式较难符合数据使用者发现或搜寻数据的逻辑
而实际上,无论是引导数据使用者发现数据或是帮助数据使用者搜寻数据,图书式的组织方式都较难以满足需求,「商品式」的组织方式则是未来可以参考的方向。所谓「商品式」组织即是参考电商网站如何通过搜索、筛选、推荐等功能方式帮助消费者发现或搜寻到所需的商品的。例如,消费者如在电商网站购买手机,同样是提供筛选功能,,电商网站除了提供按照手机自身管理类元数据筛选商品,即「按品牌」、「按价格」等方式之外,亦会围绕消费者的典型购买需求/应用场景来提供筛选选项,比如「按是否带有 NFC」、「是否大电池」等。同样的,电商网站的推荐功能并非单一的按照销售排行推荐展示,而是会一并提供例如「同类商品推荐」、「搭配商品推荐」(如购买衣服渴望城市在线观看,推荐裤子、佩饰的组合)的方式,而这些都是从消费者的购买心理和购买需求角度出发。对于数据平台而言,即是要全面拥抱应用场景,对内容进行组织并辅助搜索、筛选和推荐的功能。
而值得注意的是城市专区,关联数据将是 Web3.0的基础,而在关联数据的时代,数据交互不仅仅是基于元数据和应用场景,也基于庞大的、交叉关联的关联云/网络(Linked Data Cloud)所开展,数据平台应当有能力帮助用户基于场景的需要,依据元数据的描述,漫游关联网络从而发现、理解并利用数据。
城市数据平台被认为是一个城市所有数据资源的中央目录,用户通过它能够发现并获取数据,而基于这些数据,所能延展所做的交互例如预览、可视化、地理信息化等的想象空间是巨大的,其可衍生出的功能列表和需求是没有止境的,因而对于一个城市数据平台,面对目的不同背景不同的各阶层各类型使用者,不可能去自行建设并提供所有需要的功能。城市数据平台应当明确其核心的目的而建设功能,其服务于终端使用者解读、利用数据的功能应当通过将城市数据平台定位为可与第三方轻易链接交互的「平台」而一切都由「门户」去实现。换而言之渴望城市在线观看十大资源型城市,城市数据平台自身应当能够曝露一批 API 接口,以方便第三方简便地获取数据平台自身的元数据及其他交互能力,从而得以和第三方工具可以关联整合。事实上,CKAN以及 Scorata 等成熟的开放数据门户解决方案就已经部分实现了这一愿景,允许第三方通过 API 方式获取完整的数据目录列表、各数据集的具体元数据及交互记录等。而专业化的地理信息平台例如芝加哥的 OpenGrid ,以及 Data.gov 所增设的「Open With」 按钮正是这一类「互通」思维的先驱代表城市水资源排名。
首先从服务数据发布者角度而言,我们前文趋势中已经描绘随着数据资源范畴从政府数据逐步扩展至城市数据,数据平台本身的定位将会更为去中心化,基础设施化(底层化),因而我们对应开放策略-资源梯级模型,有以下模型:
上述模型的构建,是基于资源梯级模型和整体趋势对应产出的。我们可以看到,当资源范畴在政府或政务数据阶段时,资源端的主体类型较为一致,此时大多数情况下会选择以中心化的方式集中管理数据的发布(资源端阶梯第一阶段)。当然也不排除可以选择去中心化发布,中心化权限管理(资源端阶段第二阶段),从而方便各数据发布主体自主发布数据,但对于数据权限的管理仍旧是集中的中心化的方式。而当数据范畴扩展到公共财政覆盖的数据时,数据平台应当以去中心化的发布模式为主城市专区,可以根据需要选择中心化或者去中心化的权限管理。而当数据范畴进一步扩展到公共利益相关乃至城市数据,此时数据主体以政府直属管辖外的企业和机构为主,去中心化的发布和权限管理已经成为必然,此时数据平台应当以基础设施化路线为主,从而支撑整个城市的数据流通。而此时的数据溯源则应当从中心化溯源进化为去中心化的溯源,直至过渡到亦由数据平台作为基础设施来支撑。
而从数据平台服务数据利用者角度而言,我们认为其发展方向的主要矛盾核心在于从何角度组织对数据资源的交互,而这就是利用端的梯级模型:
从模型中我们可以看到,最早的开放数据门户是单纯的列表索引,其负责的是将以开放的数据(量很少)通过列表形式归集到一处,供使用者发现。而后,随着数据量的增长,形成了现有的传统数据门户,其主要利用数据的管理类元数据,通过搜索、筛选等方式帮助用户发现和搜寻数据。而随着数据治理水平提升,并引导用户使用的方向,数据的元数据将会更为完整和丰富,引入数据结构类元数据(范式描述)、描述类元数据(采集背景城市水资源排名、原因、方式等),这类元数据如何整合成为辅助用户发现和搜寻数据的新「交互」技术,就成为了新的发展课题。而,将不同数据通过应用场景主动「组织」起来,以及进一步通过关联数据方式,提供数据关联线索,则是未来平台的发展方向十大资源型城市。