私にはこのブログを書く権限がない。

Twitterじゃ書ききれない何かを書くアレ

Semantic WebとLinked Data

最近、Semantic WebとLinked Dataについて触れる機会があったのでメモ的に。ここでは具体的なフォーマット等は述べず、その概要だけに留めておく。
後に具体的なフォーマット等も書く可能性は十分にあるけど。

Semantic Web

Semantic Webとは

Semantic WebとはURI同士の繋がりを主語(Subject)、述語(Property)、目的語(Object)でグラフ的に表現されたものである。
具体的にはRDFと呼ばれる形式で、XMLやN-Triples等のフォーマットによって表現される。
ポイントは、RDBMSのようにバイナリファイルに記録するのではなく、XMLのような人間にとって可読性のあるフォーマットで記録している点である。
機械同士のネットワークだったものに、人間を取り込もうとする新しいWebの形を目標としている。

Ontologyとは

Wikipediaの「オントロジー (情報科学)」によれば

コンピュータ科学 (en:Computer Science)と情報科学 (en:Information Science)において, オントロジ(概念体系) は、あるドメイン内 (en:Domain of discource)の概念とそれらの概念間の関係のセットとしての知識の形式的な表現です。 それは、そのドメイン内のエンティティについての理由付 (en:Reasoning)として使われます。それは哲学用語の(オントロジ) (en:Ontology)から大きく異なります。

おそらく初見で理解できる人間は少ないだろう。
一言で言えば概念及び概念同士の関係を定義したグラフである。ここで「概念」というのは、Semantic Webにおける主語に用いられるクラスのことであり、「概念同士の関係」というのは、Semantic Webにおける述語のことである。
Semantic Webにおいては、こちらもRDFで記述される。つまり、Semantic WebにおけるOntologyとは、主語のクラス及び述語を定義したRDFファイルのことである。
また、述語は既に同じ機能・同じ意味を持つ既存の述語が存在すれば、新たに定義せず、それを使うことが一般的となっている。

Linked Dataとは

Linked Dataとは様々なモノにURIを与え、Semantic Webによってそれらのモノ同士の関係を表現したものである。
従来のデータベースにおいては、「述語」に相当する概念がなかったため、データベースの新しい形として近年注目されつつある。
データをどんどん公開していき、様々な種類のデータをリンクしていこうという思想が根本にある。
その根拠がLinked Open Dataと呼ばれるプロジェクトである。これは、公開されているRDF同士をさらに繋げていくというものである。