笈成資料庫

自由的中醫典籍資料庫

使用者工具

網站工具


jc:about

關於笈成

笈成是一個收集、整理中醫藥典籍的開放計畫,未來也會考慮納入醫家、中藥、方劑、方歌資料的整理。

本計畫源於 2009 年,當時筆者有感網路上中醫藥資料儘管繁多,許多卻已流於表面化、形式化,更糟的是往往還經不起實際的考驗,可謂徒有科學表象,卻無科學實質。

傳統中醫是一種融合科學與哲學、融貫知識與修行的學問,雖有相當比例是「統計」而來,也有不少是經由氣功、修行、甚至玄學等功夫「修證」而得。古代中醫典籍很多就像武功秘籍一樣,如果只看表面的文字,沒有實地去培養敏感的感官,對人與自然、與天地微妙關係的體會,那就只像電影裡的功夫一樣,人人打得有模有樣,戰場上卻一打就倒。

經典雖非萬能,然地基非深,萬丈不起。如不能有系統、有效率整理古人之智慧結晶,又如何奢談繼承、發展?在較早的年代,已有許多先聖先賢,不計酬勞、不慕榮利,用白紙黑字,把薪火一代一代遞到我們手上。而在數位化、E化的年代,如能善用零壹,更能快速整理、發揚先聖之結晶。

紙本有許多優點,需要精讀的典籍尤然。然而數位資料在搜尋、檢索、交叉比對、版本研究等方面卻大有助益。撰寫《本經疏證》的周潤安,為了考證整本《傷寒論》的用方用藥,花了六年的時間,當時光是要找「傷寒論中談到桂枝湯的所有條文」,就得把一本書從頭翻到尾,還不保證沒有遺漏;而在數位世界,只要有傷寒論的電子檔,按下搜尋,幾秒到幾分鐘的時間就清清楚楚。

當時筆者有幸接觸一套《漢典》程式,該程式相當輕巧(約 5 MB),支援「且」、「或」、「非」等條件組合,原始檔依內容文義分割成一個一個段落,也能一次搜尋多個文字檔案,想查什麼關鍵字,一下就找到了。但該程式也有不少限制,其一是不支援 Unicode 只支援 Big5,而 Big5 由於先天限制,缺字極多,難以完整呈現古籍原貌;此外該程式的檔案是特別切割過的格式,搜尋還算方便,當電子書從頭讀到尾就不甚合適;只支援沒有格式的純文字也是一個問題。

當時筆者開發了一套與之相似的《笈成檢閱系統》,除基本的多檔掃描、關鍵字多重條件組合搜尋以外,也支援常用的格式語法,搜尋速度經測試亦與《漢典》不相上下。之後又陸續開發了缺字自動轉換、異體字搜尋、章節段落切分、大綱呈現等功能,加上免安裝直接使用的特性,建立個人的純文字電子古籍已經很方便了。

然而《笈成檢閱系統》雖能精確檢索、分析電子檔,但檢索數百、數千筆電子檔就不堪負荷;又新版的瀏覽器因安全性理由陸續停止一些技術支援,導致《笈成檢閱系統》有無法作為永久解決方案的隱憂。

此外,儘管已有堪用的檢索系統,但更重要的「電子檔」本身,筆者卻沒有心力整理。

文學、史學、哲學類之典籍,已為許多有志之士整理、校訂。極難整理的佛教典籍1),也在cbeta電子佛典協會及無數大德的無償努力下,有了不錯的成果。

中醫典籍大多為市面上有價的書籍,紙本書不利檢索的問題前已敘明;網路上雖有為數不少的電子檔,但版本極度散亂。限於專業因素,文史研究者極少關注中醫藥這塊領域;又較諸現代醫學之眾,中醫人力之寡、職業之勞,導致來源確實、文字正統、罕字不缺、校對詳盡、排版整齊、免費公開的電子資料長期不足。

如今網路搜尋引擎逐漸發達,舊版的笈成資料檔上線後,大多已能被搜尋引擎找到,而且速度是用0.x秒幾千萬筆計算的,在網路世界中,只要把品質良好的電子資料公開放在網路上,搜尋的部分交給 Google, Bing, Yahoo 等知名搜尋引擎足矣。有些電子古籍需要付費購買,但它們仍有幾個問題:一是使用簡化字,無法呈現古籍原貌而不利考證;二是校對仍有粗糙的一面;三是付費軟體為防盜用,往往加入許多加密演算,不是不能複製貼上,就是變成只能看不能搜的圖片,即使能搜,檢索技術也往往不足,搜尋大量電子檔仍不夠快,又因付費的電子檔必不公開,非公開就代表 Google 看不到,因而也不易流通。

由於生性龜毛,筆者在查閱、使用電子檔時,常有順手校對的習慣,校對後的檔案既可自用,公開出來亦能給嘉惠他人。網路上許多人有這種觀念,但許多電子檔是被零散地貼在部落格、BBS 上,人人各行其政,甲把《傷寒論》左邊修50個字,乙把《傷寒論》右邊修70個字…到頭來大家都花了時間校訂,但每個人的電子檔仍是錯字連篇。

理想的情況應該是,有一個共同平台,甲改了50個字給大家,乙在這基礎上再改70個字給大家,如此一來就能從50、120字逐漸累積,長此以往,錯字必然越來越少,文本也會越趨正確。但…如果改錯了怎麼辦?因此又有了「版本控制」的觀念,也就是當乙改了甲的版本,除了改過的版本以外,之前甲的版本也一併記錄,並提供一套界面令使用者能自由比對不同版本的差異,作為日後修訂的參考。在這套機制下,修改者可放心地大刀闊斧,萬一資料改爛,把舊版本拿出來就好。

事實上這就是維基文庫的概念,筆者起初曾有計畫在維基文庫上整理典籍,然而許多方面受限於該系統之限制而難以實行。因而只好另外架設系統,以使原始檔能在掌控之下。這裡的資料保證公開,日後也會釋出資料檔壓縮包及檢索程式;然而我們不鼓勵閉門造車,您若有心把這裡的資料搬到維基文庫或其他類似站台,或把那些站台的資料轉移至此,我們都樂觀其成。本站的授權方式與維基文庫完全相同,只要內容沒有版權問題,都歡迎互相交流。

只期望諸位訪客、網友在使用本站之餘,能不吝花點時間,按幾個編修按鈕,改一改錯字,順一順排版。

筆者相信,把這些零散、瑣碎的力量集結起來,聚沙成塔,有朝一日,你我都能享有美好的果實!

Danny 謹識於中華民國一百年一月十七日

1) 佛典使用了大量的梵語音譯字,因而缺字眾多;又混合了中、日、英、梵、藏等多語文字,因而不易處理。
jc/about.txt · 上一次變更: 2012/05/03 01:36 由 admin