Page 1 of 1

以及最重要的是它

Posted: Sat Feb 08, 2025 3:20 am
by Bappy11
3.符号目录作为分类工具
对文字的研究主要基于目前发现的文字载体。然而,许多文本见证随着时间的流逝已被毁坏,丢失在档案馆和博物馆,隐藏在私人收藏中,或者根本尚未被发现。一方面,总是会有少部分角色没有被盘点。另一方面,可以预期未来几年还会有更多新的发现。 2018 年初,在危地马拉进行的一项大规模激光雷达调查 (Lidar:光检测和测距) 的结果出炉,结果显示热带低地的定居点比之前认为的要密集得多,[7]这也意味着文本携带者的数量更多。

碑文的重新发现以及之前未知的字符的发现对玛雅字符的分类提出了挑战。以前的字符清单在构建目录时当然只能考虑当时已知的字符。

在我们的数字标志目录中,我们希望预测新发现的情况,并将相关的标志重新分类视为一种可能的情况。因此,我们需要一个能够灵活地整合和处理新发现的数据处理流程。

与古代语言和文字的研究相比,玛雅文字的研究还比较年轻。尽管早在 19 世纪末人们就意识到许多文本中都穿插着日历日期,[8]但这些文本被否认具有历史性,从而否认具有语言基础。[9]直到 20 世纪 50 年代,尤里·克诺罗佐夫才认识到玛雅文字的表音节特征[10],并首次提供了经过语言学验证的读物。不幸的是,由于铁幕的影响,他的作品很长一段时间都没有引起研究者的注意,尽管1958年他的英文译本得以出版。[11]

尽管J. Eric S. Thompson 编制的象形文字目录[12]存在多处重复及不正确的分类,但它仍可作为研究人员进行文字识别及随后的音译的标准参考,为文本的语言学研究做准备,尽管 Thompson 拒绝了 Knorosow 的工作,并未提供任何读物。[13]迄今为止,共有 9 种其他标志清单被提出。他们全都有错误的作业。尤其成问题的是符号的多重分类,其中某个字素的几种异体字被归类为不同的符号。[14]这些目录大多是简单的图形清单。直到 1999 年克诺罗索夫死后出版的《Xcaret 概要》[15] ,读物才首次与相应的字素联系起来。然而,这些都是基于 20 世纪 60 年代的研究状况。即使是最新的两本目录[16]也只是以一种不加思考的方式描述了读数。

通过我们的数字字符目录,我们希望同时考虑字符的两个表达层次,即功能语言学和字素学,并以这样一种方式对它们进行建模,使得两个层次之间的分配都是细粒度的和灵活的。

传统字符目录的另一个缺点是,由于其印刷形式而无法更改,因此无法动态扩展。这可以防止错误分类被纠正或字符之间新的关系被建立。同样,数字形式的字符目录可以提供补救措施,因为它能够灵活地对变化做出反应,同时提供持久的识别选项。

4. 数字角色目录建模
我们正在开发数字字符目录,目的是对玛雅字符进行完整的全新清查,从而对先前已知的字符数量做出可靠的陈述。通过字符目录,我们为字符的系统化和分类建立了一个新的概念。古典玛雅语复杂的书写系统的具体特征在模型中得到了明确的体现:图形变体、多功能字符和多种音译值都有定义且相互关联。特别关注阅读假设,这些假设不仅记录在目录中,而且还进行了客观评估和定性分类,以便以准备好的形式供以后分析。该目录不仅是分类、研究文字的工具,也是碑文素材创作的核心部分。

为了开发数字存储的字符目录,必须用机器可读的模型来表示字符及其特性。我们将建模理解为数字人文研究的一种方法,旨在在数据模型中表示对象及其有关的知识。从Sowa的意义上来说,这意味着将知识对象的语义明确化,并将其转换成数据模型。[17]知识对象是指在特定知识情境中构成的具体实体的认识论表征。知识对象本身并不是存在的。它们是由知识生成过程创建的;它们是由关于认知兴趣主题的具体实体的陈述、分析和解释形成的。我们将“领域”或“对象区域”称为产生有关对象的问题的特定知识背景。

知识对象和特定主题领域的建模过程可分为以下步骤:(a)分析特定领域的需求,(b)使用概念建模进行知识表示,以及(c)构建机器可读模型。

4.1 领域特定需求分析
我们对经典玛雅人物目录的要求是通过领域专家和建模者之间密集的知识交流和传递确定的。在此过程中,确定了模型的具体要求、其在数据收集系统中的实现以及技术环境。为了确定要求,我们选择了基于专家访谈法的方法。雷因霍尔德认为,这代表了“一种充分的信息需求分析方法,特别是在数字人文学科的研究过程和研究数据建模的背景下[...],因为研究人员需要具备高度的隐性知识。” [18]但值得注意的是,只有当提问者在相关主题上已经具有很高的专业知识水平时,专家才会分享知识。[19]因此,该过程要求建模者高度熟悉该领域知识,必须能够从学科角度描述各自的学科领域和相关学科领域。

需求确定过程是联合项目工作中最跨学科的领域。根据探索性解释学方法,我们进行了如下工作:第一步是熟悉该学科领域的基本概念,即语言学和语言研究。我们还分析了符号目录这个对象,因为它是解读工作不可或缺的工具,具有特定于项目和学科的功能。此外,还对古典玛雅文字系统的结构进行了深入研究,目的是在模型中明确地展现其字符,

讨论的最终记录构成了需求目录的基础,该目录可作为确定进一步需求和明确现有需求的工作文件。利用该目录,人们讨论了个别概念,并在密集而定期的知识交流阶段就字符和书写系统的功能问题进行了辩论。

4.2 使用概念建模的知识表示
我们认为知识表示过程是一种解释方法,旨在构建机器可读的模型。概念建模用于乌克兰电报数据 定义 Sowa 所说的“本体类别”。它们决定了计算机应用程序中所能表现的所有内容。[20]本体模型的创建旨在明确描述知识对象、它们之间的关系以及它们与其领域的关系。当涉及模糊和不确定的信息时,定义这些类别尤其困难:“类别框架中的任何不完整性、扭曲或限制都必须不可避免地限制使用这些类别的每个程序和数据库的通用性”。[21]由于有关对象的“知识”可以用不同的方式来质疑或解释,因此有必要在模型中表示不同层次的知识,以抵消这种扭曲,并根据定义的本体类别精确地限制知识库。

首先,我们查阅了专业文献和语言术语,如 SIL 语言术语表[22],以寻找描述书写系统和字符的定义和概念。然而,对这些材料的分析表明,大多数概念不适用于我们的模型,因为它们过于注重在具体语言环境中的适用性。然而,我们的目标是为字符的表示及其在书写系统中的功能定义本体类别。语言类别仅适用于元层面。[23]

基于文献研究和需求分析的结果,我们定义了概念并在本体中建立了概念之间的关系以及它们与主题领域的关系模型,并将其编写为 OWL模式。图4显示了本体的领域模型,并说明了核心概念及其相互关系。

图4:字符目录本体的领域模型。概念:Franziska Diehr。
图4:字符目录本体的领域模型。概念:Franziska Diehr。
在我们的理解中,一个书面符号由两个层次的结合构成:一个语言功能层次,一方面包含按照索绪尔[24]的思想和声音形象,另一方面描述了符号在书写系统中的具体功能;另一个是图形表征层次,它包括了表征语言功能层次概念的所有可能的表征形式。