- AI 原生
- Schema.org
- 分類學
- 實體關聯
- 本體論
- 知識圖譜
- 結構化資料
- 語意網
- 資料模型
- 資訊架構
- 0 次瀏覽
- 思辨錄
- 第五部曲:重構基石
在上一篇文章中,我們確立了新架構的第一性原理:將構成世界的基本單位,從曖昧不明的「文件」,重定義為擁有唯一數位身份的「實體」。這相當於我們為數位世界創造了可靠的「原子」。
但只有原子,我們得到的還只是一個冰冷、靜默的元素週期表。要讓世界變得豐富多彩、充滿意義,我們需要讓原子能夠結合成分子,並遵循一套共同的物理和化學定律。
這,就是「語意與關聯」層的使命:為每一個冰冷的實體,注入有溫度的靈魂。
Schema.org 的啟示與局限:貼紙 vs. DNA
我們必須再次提及 Schema.org。它的偉大之處,在於它意識到了「語意」的重要性,試圖為當時基於「文件」的混亂網路,提供一套標準化的「標籤」。
然而,它的局限也正在於此。Schema.org 的標籤,就像貼在一本書封面上的「貼紙」。你可以在一本小說上貼上「科幻」的標籤,但這張貼紙本身,與書的內在基因無關,甚至可能是錯的。AI 在讀取時,依然需要進行大量的猜測和驗證。
我們的思路發生了根本性的轉變。語意不應該是事後附加的「衣服」或「貼紙」,它必須是實體與生俱來的【DNA】。
原生語意層:三個維度定義「你是誰」
在我們的新架構中,任何一個實體在被創建的那一刻,就必須從三個維度上,清晰地定義其內在的語意。
- 本質定義 (Essence Definition): 這回答了最根本的問題:「你是什麼?」當一個企業創建其實體時,它不能只是一個名字,它必須聲明其本質——例如,它「是」一個「營利性組織」。一個產品實體,必須聲明它「是」一個「軟體服務」或「實體商品」。這個定義是強制性的、機器原生可讀的,從源頭上杜絕了身份的模糊性。
- 分類法 (Taxonomy & Ontology): 這回答了:「你在世界中的位置是什麼?」每一個「本質定義」,都自動將實體歸入一個共享的、可擴展的知識分類體系中。例如,「營利性組織」是「組織」的一種,「組織」又是「法人實體」的一種。這讓 AI 不再需要從海量文本中去學習「公司是一種組織」這種常識。這個共享的「世界觀」,讓所有實體都能在一個統一的知識框架下被理解。
- 實體關聯 (Entity Relation): 這是賦予實體「靈魂」最關鍵的一步,它回答了:「你和世界萬物的關係是什麼?」我們不再滿足於描述實體自身的屬性,而是將「關係」作為資料模型的一等公民。
- 「張三」這個「人」的實體,與「A 公司」這個「組織」實體之間,存在一條「任職於」的關係。
- 「A 公司」與「B 產品」這個「軟體服務」實體之間,存在一條「開發並銷售」的關係。
- 「B 產品」與「C 模組」這個「軟體組件」實體之間,存在一條「依賴於」的關係。
從「猜測」到「理解」的飛躍
當這三層語意被內建為實體的 DNA 後,一個真正可被 AI 「理解」的網路便浮現了。
AI 不再需要耗費 90% 的算力去猜測「蘋果」到底是一種水果還是一家公司,因為每個實體的本質和關聯都已經被清晰定義。AI 的能力,將從基礎的「模式匹配」,飛躍到更高階的【邏輯推理】。
例如,AI 可以輕易地推理出:「既然張三任職於 A 公司,而 A 公司是一家軟體公司,那麼張三很可能具備軟體開發或管理的相關知識。」這個結論,是在沒有任何一篇文章直接說明的情況下,透過實體間的關係網路推導出來的。
這才是 schema.org 最初夢想的、一個真正由語意驅動的、機器可以直接理解其內在邏輯的智慧網路。
在為世界的基本粒子賦予了「身份」和「靈魂」之後,這個世界還缺少最後一個關鍵維度——動態。下一篇文章,我們將探討如何為這個結構化的世界,注入「時間」與「行為」的脈搏,讓它真正地「活」起來。