我國(guó)少數(shù)民族歷史悠久,許多少數(shù)民族在歷史上創(chuàng)制了古民族文字,并以民族文字形成了極其豐富的反映各民族社會(huì)歷史發(fā)展情況的文字歷史檔案。研究少數(shù)民族文字歷史檔案數(shù)字化建設(shè)的現(xiàn)狀與對(duì)策問(wèn)題,可更好地發(fā)掘、傳播與利用這一優(yōu)秀的民族歷史文化遺產(chǎn)。
一、少數(shù)民族文字歷史檔案數(shù)字化建設(shè)的現(xiàn)狀
少數(shù)民族文字歷史檔案是指建國(guó)前少數(shù)民族地方政權(quán)、土官、個(gè)人在其社會(huì)歷史發(fā)展過(guò)程中以本民族文字直接形成的反映少數(shù)民族政治、歷史、經(jīng)濟(jì)、軍事、天文、歷法、醫(yī)藥、教育、文藝、哲學(xué)、倫理、宗教和民俗等方面情況,具有保存價(jià)值的各種不同形式的歷史記錄。少數(shù)民族文字歷史檔案數(shù)量豐富、種類(lèi)繁多,其中較為典型的是滿(mǎn)文、藏文、維吾爾文、彝文、傣文、東巴文、白文、壯文、苗文、瑤文和水書(shū)等檔案材料,按其現(xiàn)存方式可劃分為古籍、文書(shū)、石刻(又包括碑刻、摩崖、石經(jīng)墻、石經(jīng)片和石經(jīng)墩等類(lèi)型)、金文、印章、竹簡(jiǎn)、木刻、貝葉、骨文、皮書(shū)、布書(shū)、瓦書(shū)和陶文等。現(xiàn)今,少數(shù)民族文字歷史檔案的數(shù)字化建設(shè)處于起步階段,現(xiàn)狀如下:
1 .少數(shù)民族文字?jǐn)?shù)字化技術(shù)多為高校、民族研究所、計(jì)算機(jī)中心等機(jī)構(gòu)進(jìn)行開(kāi)發(fā)。以藏文數(shù)字化技術(shù)的研究為例。1986年由青海師范大學(xué)研究開(kāi)發(fā)的TCDOS2.0版藏文系統(tǒng)通過(guò)了鑒定,這是第一個(gè)收入使用的藏文系統(tǒng);中國(guó)藏學(xué)研究中心和航天部701所于1988年8月推出了藏文文字處理及激光編輯排版印刷系統(tǒng),后與濰坊華光合作開(kāi)發(fā)出了華光書(shū)林藏文排版和激光照排系統(tǒng);中國(guó)計(jì)算機(jī)軟件與技術(shù)服務(wù)總公司、民族印刷廠、北京大學(xué)計(jì)算機(jī)研究所、中國(guó)民族語(yǔ)文翻譯中心聯(lián)合研制并推出了北大方正藏文書(shū)版系統(tǒng),北大方正1997年推出了基于WIN31的藏文維思彩色印刷系統(tǒng);西南民院計(jì)算機(jī)研究室開(kāi)發(fā)了基于DOS平臺(tái)的SPDOS漢藏文版操作系統(tǒng)和藏文文字平臺(tái)。
2 .北方地區(qū)少數(shù)民族文字?jǐn)?shù)字化技術(shù)的研究領(lǐng)先于南方地區(qū)。除藏文外,其他少數(shù)民族文字?jǐn)?shù)字化技術(shù)開(kāi)發(fā)情況如下:
?。?)蒙古文。內(nèi)蒙古計(jì)算中心開(kāi)發(fā)出蒙文、漢文、英文操作系統(tǒng),與山東濰坊合作研發(fā)出華光V型蒙文書(shū)刊、圖表、報(bào)紙激光照版系統(tǒng);內(nèi)蒙古大學(xué)研制出MPS蒙漢混合字處理系統(tǒng);內(nèi)蒙古大學(xué)與北大合作開(kāi)發(fā)出《北大方正電子出版系統(tǒng)》蒙文版。內(nèi)蒙古社會(huì)科學(xué)院蒙文研究所的蘇·蘇雅拉圖研制出基于Windows95的蒙古文處理系統(tǒng)(便攜式計(jì)算機(jī))。
?。?)維、哈、柯文。主要有1989年新疆民語(yǔ)委主持開(kāi)發(fā)的博格達(dá)維、哈、柯、漢、英、俄多文種排版系統(tǒng);北大方正及濰坊華光已都研制有維、哈、柯文的排版系統(tǒng);1997年6月新疆開(kāi)發(fā)的《未來(lái)多文種系統(tǒng)VTDOS6.1》。
?。?)朝鮮文。如方正朝鮮文書(shū)版系統(tǒng)和思維系統(tǒng);華光推出的書(shū)林朝鮮文系統(tǒng)。
?。?)錫伯文、滿(mǎn)文。有新疆民語(yǔ)委主持開(kāi)發(fā)的計(jì)算機(jī)錫伯文、滿(mǎn)文文字處理和輕印刷系統(tǒng);內(nèi)蒙古大學(xué)等研制的滿(mǎn)文系統(tǒng);遼寧省檔案館和東北大學(xué)計(jì)算機(jī)語(yǔ)言工程研究室共同開(kāi)發(fā)的滿(mǎn)文操作系統(tǒng)。
?。?)彝文。有北大方正和西南民院合作開(kāi)發(fā)的彝文系統(tǒng)書(shū)版軟件;西南民院自行開(kāi)發(fā)的VCDOS漢彝文雙語(yǔ)平臺(tái)和SPDOS漢彝文版漢字操作系統(tǒng),后又推出了Win95彝文文字平臺(tái);由云南省民語(yǔ)委和云大計(jì)算中心合作開(kāi)發(fā)的云南規(guī)范彝文排版系統(tǒng)。
(6)傣文。北大方正開(kāi)發(fā)的傣文電子出版系統(tǒng);濰坊華光開(kāi)發(fā)的傣文電子排版系統(tǒng)。
?。?)壯文。由北大方正研制的在英文基礎(chǔ)上稍加改造后實(shí)現(xiàn)的壯文書(shū)版系統(tǒng)。
?。?)苗文。云南省楚雄州光亞電子研究所研制的苗文排版系統(tǒng)。
3 .檔案系統(tǒng)少數(shù)民族文字歷史檔案的數(shù)字化管理工作尚未全面開(kāi)展。現(xiàn)今少數(shù)民族地區(qū)許多檔案館(室)都收集珍藏有滿(mǎn)文、藏文、維吾爾文、彝文、傣文、東巴文、白文、壯文、苗文、瑤文和水書(shū)等少數(shù)民族文字歷史檔案,這些檔案大多處于手工管理階段,只有少數(shù)檔案部門(mén)開(kāi)展了少數(shù)民族文字歷史檔案信息的數(shù)字化工作,檔案系統(tǒng)尚未開(kāi)發(fā)出單一或多民族的數(shù)字化管理系統(tǒng)軟件;在現(xiàn)有檔案管理軟件中,也沒(méi)能開(kāi)發(fā)出少數(shù)民族文字歷史檔案的管理功能,這就極大地限制了少數(shù)民族文字歷史檔案的利用效率與范圍。
二、少數(shù)民族文字歷史檔案數(shù)字化建設(shè)的方法
?。ㄒ唬┮M(jìn)與采用少數(shù)民族文字?jǐn)?shù)字化的技術(shù)與科研成果
如許多高校、民族研究所、計(jì)算機(jī)中心等機(jī)構(gòu)在少數(shù)民族文字處理技術(shù)方面開(kāi)發(fā)出了藏文、蒙文、維文、朝鮮文、錫伯文、滿(mǎn)文、彝文、傣文、壯文、苗文等。在數(shù)據(jù)庫(kù)建立方面,蒙古文和藏文取得了顯著的成績(jī)。1987年完成中世紀(jì)蒙古語(yǔ)文數(shù)據(jù)庫(kù);1993年在完成100萬(wàn)詞綴(現(xiàn)代蒙古語(yǔ)文數(shù)據(jù)庫(kù))的基礎(chǔ)上,又完成了《500萬(wàn)詞級(jí)現(xiàn)代蒙古語(yǔ)文數(shù)據(jù)庫(kù)》;完成了《元朝秘史》拉丁標(biāo)注、漢文標(biāo)注和漢文旁注本的檢索統(tǒng)計(jì)系統(tǒng),在《現(xiàn)代蒙古語(yǔ)詞頻統(tǒng)計(jì)》的基礎(chǔ)上又整理出《現(xiàn)代蒙古語(yǔ)頻率詞典》;研制了MHJ—1型蒙古語(yǔ)言分析軟件包;1990年推出蒙古文拉丁化輸入方法,開(kāi)發(fā)了從新蒙古文到老蒙古文的轉(zhuǎn)寫(xiě)軟件,完成了蒙古文詞根、詞干和附加成分的自動(dòng)切分與復(fù)合詞的自動(dòng)識(shí)別系統(tǒng);蒙文字幕機(jī)系統(tǒng),蒙漢混排圖章計(jì)算機(jī)輔助設(shè)計(jì)系統(tǒng),篆文刻繪系統(tǒng),蒙語(yǔ)文節(jié)目微機(jī)管理系統(tǒng),微機(jī)蒙文圖書(shū)目錄管理系統(tǒng),蒙醫(yī)癲癇病專(zhuān)家系統(tǒng)等。
此外,廣西壯族自治區(qū)語(yǔ)委主持開(kāi)發(fā)了壯語(yǔ)詞庫(kù);西南民族學(xué)院開(kāi)發(fā)出彝文(四川涼山規(guī)范彝文)字幕機(jī)系統(tǒng);中國(guó)社會(huì)科學(xué)院民族研究所完成了1994年基金項(xiàng)目——中國(guó)少數(shù)民族語(yǔ)言文字多媒體數(shù)據(jù)庫(kù)。這些少數(shù)民族文字?jǐn)?shù)據(jù)庫(kù)的建立,為少數(shù)民族文字歷史檔案的數(shù)字化提供便利條件。
?。ǘ┓e極開(kāi)展少數(shù)民族文字歷史檔案的數(shù)字化工作
1 .鍵盤(pán)輸入。鍵盤(pán)輸入是少數(shù)民族文字歷史檔案數(shù)字化的一種基本形式,目前已經(jīng)開(kāi)發(fā)出許多少數(shù)民族文字輸入法,各民族地區(qū)的檔案館(室)工作人員可根據(jù)所管理少數(shù)民族文字歷史檔案的情況選擇具體的少數(shù)民族文字輸入法,以作為少數(shù)民族文字歷史檔案數(shù)字化的基本工具。
2 .掃描儀。掃描儀的工作原理是把紙上的圖形、圖像或文字信息變成像素點(diǎn)陣,再用二進(jìn)制數(shù)表示這些點(diǎn)陣,從而將圖形、文字變成數(shù)字,輸入計(jì)算機(jī)。由于掃描儀可以將整頁(yè)的少數(shù)民族文字、圖形或圖像直接輸入計(jì)算機(jī),因而在少數(shù)民族文字歷史檔案信息的輸入方面具有廣闊的應(yīng)用前景。
3 .?dāng)?shù)碼相機(jī)及攝像頭。數(shù)碼相機(jī)攝制的圖像可以通過(guò)標(biāo)準(zhǔn)串/并行口輸入到計(jì)算機(jī),內(nèi)部的PC卡可以直接插入計(jì)算機(jī)使用,拍攝到的圖像可以用計(jì)算機(jī)進(jìn)行處理,保持圖像的原樣而不失真,圖像質(zhì)量很高。數(shù)碼相機(jī)及攝像頭可用于少數(shù)民族文字歷史檔案的拍攝、復(fù)制、存儲(chǔ)和傳輸利用。
通過(guò)以上各種現(xiàn)代化技術(shù),即可將各種類(lèi)型、各種形式、各種載體的少數(shù)民族文字歷史檔案信息輸入計(jì)算機(jī),建立完善的數(shù)字化少數(shù)民族文字歷史檔案信息系統(tǒng)。
?。ㄈ╅_(kāi)發(fā)少數(shù)民族歷史檔案數(shù)字化管理系統(tǒng)
少數(shù)民族歷史檔案數(shù)字化管理系統(tǒng)是一類(lèi)可擴(kuò)展的知識(shí)網(wǎng)絡(luò)系統(tǒng),可采集、加工、處理、存儲(chǔ)、組織、發(fā)布和利用少數(shù)民族文字歷史檔案信息資源,管理軟件的開(kāi)發(fā)應(yīng)遵循以下原則:
1 .標(biāo)準(zhǔn)化建設(shè)
?。?)編碼字符集標(biāo)準(zhǔn)、鍵盤(pán)標(biāo)準(zhǔn)、字模標(biāo)準(zhǔn)。如內(nèi)蒙古自治區(qū)計(jì)算中心完成蒙文字符集、鍵盤(pán)、字模國(guó)家標(biāo)準(zhǔn);新疆語(yǔ)委主持完成維、哈、柯文的字符集、鍵盤(pán)、字模國(guó)家標(biāo)準(zhǔn);在國(guó)家語(yǔ)委和國(guó)家技術(shù)監(jiān)督局及電子部的直接指導(dǎo)下,西藏自治區(qū)藏語(yǔ)文指導(dǎo)委員會(huì)辦公室主持,西藏大學(xué)、西北民族學(xué)院、青海師范大學(xué)共同完成了藏文編碼字符集、鍵盤(pán)、字模的國(guó)家標(biāo)準(zhǔn),這一標(biāo)準(zhǔn)正式由國(guó)際10646(即ISO\10646)大字符集討論通過(guò),成為我國(guó)第一個(gè)進(jìn)入10646國(guó)際字符集標(biāo)準(zhǔn)基本平面的少數(shù)民族文字字符集;四川省民族委辦公室主持完成了彝文字符集、鍵盤(pán)、字模的國(guó)家標(biāo)準(zhǔn);錫伯文信息處理信息交換用七位和八位編碼圖形字符集國(guó)家標(biāo)準(zhǔn)正在編制中。此外,國(guó)際標(biāo)準(zhǔn)1%文字符集的蒙文字符集、彝文字符集、維、哈、柯文字符集的補(bǔ)充集和錫伯文字符集正在制定中。
?。?)術(shù)語(yǔ)標(biāo)準(zhǔn)化。正在制定的國(guó)家標(biāo)準(zhǔn)有蒙古語(yǔ)術(shù)語(yǔ)標(biāo)準(zhǔn)化的一般原則與方法,藏語(yǔ)術(shù)語(yǔ)標(biāo)準(zhǔn)化的一般原則與方法,維吾爾語(yǔ)術(shù)語(yǔ)標(biāo)準(zhǔn)化的一般原則與方法,朝鮮語(yǔ)術(shù)語(yǔ)標(biāo)準(zhǔn)化的一般原則與方法等,均為北方少數(shù)民族的術(shù)語(yǔ)標(biāo)準(zhǔn)化原則與方法。此外,還有蒙、藏、維、哈、柯、朝等語(yǔ)種的辭書(shū)編纂一般原則與方法國(guó)家標(biāo)準(zhǔn)正在計(jì)劃制定和修訂中。
?。?)檔案標(biāo)準(zhǔn)化。在軟件的設(shè)計(jì)與選用上,首先要看是否是在檔案管理標(biāo)準(zhǔn)指導(dǎo)下開(kāi)發(fā)出的軟件。開(kāi)發(fā)少數(shù)民族歷史檔案管理軟件可參照采用的檔案標(biāo)準(zhǔn)有《檔案著錄規(guī)則》、《文獻(xiàn)保密等級(jí)代碼》、《國(guó)家機(jī)關(guān)公文格式》、《檔案分類(lèi)標(biāo)引規(guī)則》、《計(jì)算機(jī)軟件開(kāi)發(fā)規(guī)范》等。
2 .動(dòng)態(tài)性原則
?。?)采用新型數(shù)據(jù)庫(kù)管理系統(tǒng)。由于Windows系統(tǒng)的廣泛流行,F(xiàn)oxpro關(guān)系型數(shù)據(jù)庫(kù)正逐漸取代老的數(shù)據(jù)系統(tǒng),它可以高度兼容Dbase和Foxbase,具有操作更簡(jiǎn)捷,調(diào)整修改方便,界面美觀等特點(diǎn)而成為軟件開(kāi)發(fā)者的強(qiáng)有力的工具之一。
?。?)注意留有二次開(kāi)發(fā)接口。在檔案管理自動(dòng)化方面有一些項(xiàng)目有待完善與改進(jìn),如文獻(xiàn)主題詞的標(biāo)引,不同文體之間的相互轉(zhuǎn)換,文獻(xiàn)全文關(guān)鍵詞檢索,以及自動(dòng)組卷排列等。因此,少數(shù)民族歷史檔案管理軟件設(shè)計(jì)要先構(gòu)建總體結(jié)構(gòu),留有補(bǔ)充功能接口,在不斷升級(jí)的過(guò)程中完善和增加各種功能。
3 . 注重系統(tǒng)的擴(kuò)展性
在設(shè)計(jì)和選購(gòu)軟件時(shí),要考慮有相應(yīng)功能的驅(qū)動(dòng)軟件,如多媒體操作系統(tǒng),多媒體窗口系統(tǒng)和多媒體數(shù)據(jù)庫(kù)管理系統(tǒng),可增加掃描儀、光盤(pán)驅(qū)動(dòng)器、可擦寫(xiě)光盤(pán)機(jī)以及聲卡、視卡等硬件,并可組成一臺(tái)完整的多媒體少數(shù)民族歷史檔案管理系統(tǒng)。
?。ㄋ模┳龊脭?shù)字化少數(shù)民族文字歷史檔案的利用工作
1 .少數(shù)民族文字歷史檔案信息的檢索。目前,許多計(jì)算機(jī)信息管理軟件都有制作多種檔案檢索工具和多數(shù)據(jù)庫(kù)文獻(xiàn)查詢(xún)檢索的功能。各個(gè)檔案機(jī)構(gòu)在開(kāi)發(fā)少數(shù)民族歷史檔案管理系統(tǒng)時(shí),應(yīng)能夠進(jìn)行多數(shù)據(jù)庫(kù)多線索的少數(shù)民族文字歷史檔案模糊查詢(xún),可以按照文字類(lèi)別、文獻(xiàn)標(biāo)題、文獻(xiàn)主題詞、文獻(xiàn)載體材料、文獻(xiàn)所屬類(lèi)別、民族類(lèi)別、形成時(shí)間等項(xiàng)目進(jìn)行多途徑檢索,并且可以將檢索出的結(jié)果由用戶(hù)自己設(shè)計(jì)打印出來(lái)。
2 .少數(shù)民族文字歷史檔案信息的輸出利用。在少數(shù)民族文字歷史檔案信息的輸出利用方面,計(jì)算機(jī)網(wǎng)絡(luò)具有強(qiáng)大的傳輸功能。在計(jì)算機(jī)網(wǎng)絡(luò)建設(shè)方面,根據(jù)國(guó)內(nèi)外經(jīng)驗(yàn),考慮到我國(guó)通信技術(shù)和通信線路設(shè)備的現(xiàn)狀,利用微型機(jī)靈活性強(qiáng)、價(jià)格較低、建網(wǎng)快、易于普及等條件,首先在各主要民族地區(qū)建立微機(jī)局域網(wǎng)絡(luò)系統(tǒng),實(shí)現(xiàn)一定范圍內(nèi)的少數(shù)民族文字歷史檔案信息資源共享。待條件成熟時(shí),再在局域網(wǎng)絡(luò)的基礎(chǔ)上建成全國(guó)性的大型網(wǎng)絡(luò),便于社會(huì)各界對(duì)少數(shù)民族文字歷史文獻(xiàn)的查詢(xún)、研究和利用。