民俗文化的数字化水平已经成为一个国家信息基础设施完善程度的一个重要标志。当前,一些国家无不以国家政策为主导,以公共资金为启动资源,来建设民俗文化的数字化平台。民俗文化的数字化保护工作也随着信息基础设施的建设而逐步展开。民俗地图作为民俗文化研究的可视化表现方式和手段,在民俗学的研究中具有较好的应用。因此,利用当下热门的大数据等现代信息技术手段,构建数字化的民俗文化地图,可有效地促进民俗文化的大发展、大繁荣,有利于民俗文化的发展和传承。
◆传统民俗文化资源的知识化◆
民俗文化地图的构建过程,涉及民俗文化原始素材的采集和整理、民俗文化的知识化和数字化、民俗知识的大数据抓取以及民俗数据的可视化等多个方面。其中,民俗文化的知识化是民俗地图构建的基础,民俗知识的大数据抓取是关键,接下来我们首先探讨民俗文化的知识化过程。
中华传统民俗文化丰富多彩,形式多样,不同地域、不同姓氏的遗产素材会略有差别。在素材的收集和整理过程中,可以首先对素材按形成因素进行分类,如语音类民俗可以采用电子录音等形式采集。而对歌舞类动态素材则采用视频收集以及传承人口传身受的方式采集;然后再按人文特征、地域特征、伦理特征以及因果特征等因素进行分类,以便后续民俗文化本体建模。民俗文化展示形态多样,包括歌舞、音视频、器物摆设以及田野调查的图片等,民俗文化丰富的表现形态与数据库建设单一的数据编码形成了一对天然的矛盾。因此,我们根据本体模型构建的一般原则和思路,民俗本体构建遵循本体完整性、真实性、实用性、可维护性和可扩展性等原则;根据民俗领域专家和知识专家的建议在民俗文化建模,在民俗本体模型的基础上,再对领域本体细化,构建领域本体的概念属性及分面定义,为表现形态丰富的民俗文化创建民俗知识库。
◆民俗文化知识抓取、存储及抽取策略◆
现有的传统民俗文化除了一些基本的文字材料外,其他的结构化知识很少,大部分的民俗文化体现在各种WEB页面和自媒体文档中,难以直接应用于民俗地图研究。前述民俗本体模型相当于系统中的元数据,分散在各个系统中的民俗文化资料才是本项目研究所需要的数据,可用于民俗地图应用的数据获取涉及数据的抓取、存储以及抽取等技术环节。在后面的研究中,我们将基于大数据技术,在众多的URL数据源中,采取多线程网络爬虫,基于改进的广度,优先搜索策略抓取相关数据,并完成民俗知识库的存储设计。在知识库基础上,设计基于民俗文化本体的本体属性关系抽取算法,研究关系描述模式挖掘、上下文模式规则库生成以及字符匹配规则库生成;从而完成基于字符的匹配和基于规则的上下文模式识别,完成原始抓取数据的解析和抽取,从而为民俗地图的构建提供有效数据。
◆民俗文化数据的可视化◆
基于民俗文化知识图谱集成平台,运用分布式处理系统将海量传统文化资源数字化、结构化和知识化,为实现数字文化提供技术支持和平台支持。此外,为实现信息共享和提高平台可用性,该平台以知识抽取层为核心、以数据存储层为基础、以数据控制层为保障、以查询处理层为业务,研究民俗文化中的地名地理数据与GIS系统中的地理数据匹配。其实现了数据获取、处理和民俗地理数据与GIS系统的无缝衔接,从而完成传统民俗文化信息的可视化展示与应用,为民俗文化的传承与保护提供新的技术手段,为其他民俗文化和非物质文化遗产的保护与传承提供借鉴。在民俗数据可视化阶段,则以民俗知识图谱和GIS模块为基础,研究民俗地理数据与GIS地理数据的整合,以示意图的方式将不同地域特征的民俗事件显示在地理信息系统之上。同时,将不同时间段不同民俗事件的出现频率保存在相关数据项中,为民俗文化工作者判断民俗事件的发展传承规律,提供一手数据,从而促进民俗文化的大发展和大繁荣。
随着大数据、云计算以及物联网技术的发展,民俗文化的数字化有必要从原始的保存最基本的文字资料和音视频资料的低水平数字化提升到民俗文化的知识化、大数据化,从而为文化数字平台建设提供海量数据资源。民俗文化地图的构建,能够为挖掘中华民族丰富的民俗文化资源、实现文化服务形式创新和文化资源共享提供技术支持。
原标题:理论驿站|大数据时代的民俗文化数字化构建方法与路径探讨
来源|中国论文网,有删改
文|李庆华杨俊杰