Tip:
Highlight text to annotate it
X
譯者: Nan-Kun Wu 審譯者: Wen-Hsin (Willy) Feng
這是地球的照片
看起來和廣為人知的阿波羅計劃中 拍到的照片很像
看起來和廣為人知的阿波羅計劃中 拍到的照片很像
但其中有些差異
你可以點擊它
如果你點擊它
你就可以放大地球上的幾乎每個地方
舉例來說,這是洛桑聯邦理工學院的鳥瞰圖
舉例來說,這是洛桑聯邦理工學院的鳥瞰圖
很多時候你也可以從旁邊的街上
看到某棟建築物的的長相
這真的很神奇
但這趟美妙的旅程還少了一樣東西:
時間
我不確定這張照片是什麼時候拍的
我甚至無法確定這是在鳥瞰圖的當下拍的
我甚至無法確定這是在鳥瞰圖的當下拍的
在我的實驗室的研發工具
不止用在空間的旅行
也用在時間的旅行
我們想問的問題是
有辦法做出過往時間的Google Maps嗎?
有辦法在Google Maps上增加一個滑桿
只要改變年份
就可以看到100年前
1000年前的樣子嗎?
這可能嗎?
我能夠重建過去的社群網路嗎?
我可以建立中世紀時的Facebook嗎?
我能夠建造時光機嗎?
我們可以說:「不,這不可能。」
或者,我們可以從資訊的角度來看
我把這個稱之為資訊蘑菇
縱軸是時間
橫軸是我們擁有的數位資訊
很明顯的,在過去的10年中 我們擁有很大量的資訊
也看得出來,越早以前資訊就越少
如果我們想建立過去的Google Maps
或是過去的Facebook
我們就必須擴大這個空間
像是一個長方形
這要如何做到呢?
一個辦法是數位化
有很多的材料可以用--
報紙、印刷書本
好幾千本印刷書本
我可以把它們全部數位化
我可以從當中截取資訊
當然,當時間越往前 你擁有的資訊就越少
所以,這可能不夠
因此,我可以做史學家們做的事
我可以推論
這就是我們在電腦科學中所稱的模擬
如果我有一本航海日誌
我可以不只把它看成是一位威尼斯船長 特定的航程
我可以把它看成是當時許多航程的代表
我就是在推論
如果我有一幅建築外觀的繪畫
我可以不只把它看作特定的一棟建築
這棟建築可能和其它遺失了資訊的 建築有著相同的風格
如果我們想要打造一台時光機
我們需要兩樣東西
大量的檔案
也需要很厲害的專家
威尼斯時光機 (The Venice Time Machine)
也就是我接下來要跟你們談論的計劃
這個計劃是由洛桑聯邦理工學院和 威尼斯大學所合作
威尼斯有個特點
它的管理非常非常的官僚
他們持續紀錄了每一件事情
就像Google一樣
在政府典藏中心 (Archivio di Stato)
有長達80公里的檔案
記錄了超過1000年來 威尼斯生活的每個面相
每一艘出海的船
每一艘返航的船
在這城市裡面的每一個變化
都記錄得一清二楚
我們正建立一個10年的數位化計劃
要把這個龐大的檔案 轉換成一個巨大的數位系統
我們想達成的目標是
每天可以數位化450本書
當然,只有數位化是不夠的
因為這些文件大部份都是用拉丁、 托斯卡納、威尼斯方言寫的
所以有時必須轉錄、翻譯它們 並編成索引
而這理所當然並不容易
特別是當傳統的光學字符識別法 運用在手寫稿上
效果不若列印稿的時候
解決辦法是借助另外一個方法:語音識別
這個方法看似不可能 但卻是可行的
只需要加入額外的條件
如果你有一個很好的語言模型 曾經被使用過
如果你有一個很好的文件模型 那它們就已經很完整了
而這些是官方文件 很多都非常完整
當你把這巨大的檔案分成許多小子集
而每個子集都有共同的特徵的話
成功的機會就很大
如果我們達到這個階段 就能夠做其他事情:
汲取這個文件中的資訊
事實上這個檔案中大約可以汲取出100億個事件
這個巨型資訊系統可以用多種方法搜尋
例如,你可以問這樣的問題
「誰在1323年住在這座皇宮裡面?」
「1434年時Realto市場裡一條鯛魚多少錢?」
「在十年中Murano玻璃工匠的薪水多高?」
你也可以問更大的問題
因為它是用語意編碼的
然後你就可以把它放在空間中
因為大部份的資訊都是空間性的
接下來就可以重建這座城市非凡的旅程
這座城市設法永續發展超過1000年
設法讓時間和環境取得平衡
你可以重建這趟旅程
用不同方法看到它
但是當然,如果只是用看的 你無法了解威尼斯
你要把它放到一個更廣大、 歐洲的概念裡面
所以這個想法同時也要把檔案 放在歐洲的層級中
我們也可以重建威尼斯這個海上帝國的旅程
了解它是如何積極地控制亞德里亞海的
如何成為中世紀控制了大部分 東方以及南方航線的最強大的帝國
你甚至可以做到其它事
因為這些航線有相似之處
可以更進一步建立模擬系統
建立地中海模擬器
它可以重建我們遺失的資訊
讓你在用路線規劃時的 問題可以得到解答
「如果我在1323年的科孚,想去康士坦丁堡 我要去哪裡搭船?」
我們或許可以在一天,兩天或三天的 準確度之內回答這個問題
「要花多少錢?」
「有多大的機率遇到海盜?」
當然,你懂的,這種計劃最大的挑戰 在於修飾、量化
並在每一步驟重現不確定以及不一致的資料
這份文件裡到處都有錯誤
文件裡的錯誤包括把 船長的名字搞錯了,而有些船根本沒下過水
也有翻譯的錯誤,翻譯時的誤解
此外,在用演算法的時候會有辨認上的錯誤
汲取上的錯誤
所以你會得到相當相當不確定的數據
那我們要如何找到並修正這些不一致之處呢?
我們如何重現不確定性?
很困難。你可以做的一件事是把每一個步驟建檔
不只是把歷史訊息編碼
也把所謂的元歷史(meta-history)訊息
也就是建立歷史知識的根基的每一步都建檔
這沒辦法保證我們確實涵蓋到 威尼斯的每一個故事
但我們確實根據完整文件重建了威尼斯 每一個可能發生過的故事
也許地圖不止一幅
可能有好幾幅地圖
系統應該要可以到這樣子
因為我們得面對一個新型態的不確定性
包含這樣龐大且新穎的資料庫
那我們要如何把這個新研究告訴大眾呢?
威尼斯是個絕佳的地方
由於每年有好幾百萬的遊客
這裡是試著創造未來博物館最好的地點之一
想想,平躺的是建立出的特定年份的地圖
立著的是用來重建這幅地圖的文件 例如,圖畫
想像一個讓你彷彿置身於特定年份的 威尼斯的沈浸式系統
一種讓你能和別人分享的經驗
相反的,想像你能夠從一份 威尼斯手稿開始
看看你到底能夠從當中建立什麼
它是如何被解碼、當中所蘊含的概念是如何重建
這張圖片是現在在日內瓦的展覽當中展出
它就是用這類系統所建立的
總而言之
人文研究正走向一場
像是生命科學30年前所經歷的革命
事實上,問題在於它的規模
我們看到
這些計劃遠超出任何一個 小型研究團隊所能夠做的
這在人文領域也很新穎
人文領域習慣小團隊或是只和數個研究員合作
當你造訪政府典藏中心時
你會感覺到這超過任何一個團隊做得到的
這必須依賴團隊合作
在這個典範轉移中
我們必須培養一些新一代
準備好迎接這個進步的 「數位」人文學家
謝謝
(掌聲)