陈逸光,网际网路中医药典籍文献动态资料库研究,中医药杂志,11(1):43-50,2000。

网际网路中医药典籍文献动态资料库研究

陈逸光

慈济大学医学系 中国医药学院中医学系

慈济综合医院(花莲总院)

 

TCMET(中医药典籍文献)网站已于民国八十六年十二月成功登录在网际网路上,文献系统架构亦于八十七年元月完成。景岳全书全文索引包括:新、古方八阵共二仟余方及类证治裁等文献档亦成功设置完成。本网站由两年的统计资料得知己超过两万人次上网参观,并且下载及阅览资料库之中医文献资料已超过五千万笔。本文分四项主题说明中医古籍文献动态资料库建构原理: (1) 网际网路及资料库伺服器对外通讯架设原理。 (2)中医古籍文献由文字档转换成资料库档之运用。 (3)景岳全书及类证治裁资料表格化,务求易学易用易懂。 (4) 有关建置本网页之基本资讯理论详加讨论。本系统分别在微软NT4.0版、Oracle7.3资料库下建构,相当之安全、快速、稳定。目前本网站只完整收录黄帝内经、金元四大家及景岳全书共二佰余万字在TCMET网站,还有成千上万中医药古籍文献等着整理增加到网路上。

关键词:中医药典籍文献,网际网路,主从架构,资料库,网页。

前  言

  迎接公元2000年高速网际网路通讯时代的来临,中医中药研究者参予建设是必然的趋势,当今两个国内知名网站中文雅虎蕃薯藤登录的中医中药网页分别为30余及100余种。在百余种中医药网际网页中,以动态资料库形式建构的中医药文献索引网站约有三四个 (包括TCMET) 其中医疗卫生研究资讯网(www.hint.org.tw)网站提供中医药期刊索引计有(1)国立中国研究(2)北京中医研究院传统医学资料库,期刊文献检索多达 35万余篇。

 

本研究TCMET(Traditional Chinese Medicinal Electronic Text)网页则提供中医古籍文献检索功能,上述百余种建置在网际网路上的中医药网页都各有特色,可谓百家争鸣。 据统计,截至19999月全球的网域(DOMAINS)登记为一千万户,包括台湾的二万户1,而在 1996 年初全球的网域登记只有 24 万户,成长遽增。当今网际网路无远弗届,提供人们一个庞大而专业化的知识宝库,一个精良设计的网站将会吸引成千上万的网友浏览反则乏人问津,因此本研究尽量满足使用需求并导入资讯决策理论而设计,缔造一个易学易用之网路环境。

  早在民国八十五年行政院卫生署中医药委员会资讯典籍组林弘基组长推动网际网路中医古籍文献资料库网页建构计划。其主菜单是在WINDOW NT 4.0系统下,以ORACLE 7.3资料库为系统架构,建立一个易学易用 (USER FRIENDLY )网站界面。笔者于八十六年五月开始着手规划此网站,于八十六年十二月首次成功以动态资料库形式建构中医药结构化网页WWW.TCMET.COM.TW。民国八十七年六月完整将景岳全书建置完毕,现今已超过二万人次上网寻找或下载资料。本文将论述以中医古籍文献为基础之动态网页设计原理,并分四项主题说明: (1) 网际网路(WEB)及资料库( DATABASE ) 伺服器对外通讯架设原理。(2)中医古籍文献由文字档转换成资料库档供伺服器使用。(3)将景岳全书资料分门分类整理,营造一个易学易用易懂的环境。(4)应用基本的资讯理论在有限的通讯环境下,以最佳化的网页传输技术供网友使用。网路通讯及资讯理念日新月异,期盼本文能抛砖引玉,使更多学者专家投入中医网页的投资及设计。

材料与方法

() TCMET软硬体需求

1.1硬体

(1) 2PENTIUM II 350 MHz电脑   (2) 1台固接MODEM

(3) 1ROUTER           (4) 1 SWITCH HUB

  各项硬体组合(见图一)

 

图一 网际网路TCMET (中医古籍文献) 系统架构图

1.2软体

(1) WINDOW NT 4.0 (2) INTERNET INFORMATION SERVER (II S) 3.0版。

(3) FRONT PAGE EXTENSION SERVER (4) ACTIVE SERVER PAGE (ASP)

(5) ORACLE DATABASE SERVER 7.3 版。(6) VISUAL FOXPRO 5.0 版。

(7) MICROSOFT INTERDEV 1.0 版。   (8) MICROSOFT ODBC

各项软体功能(见表一)

表一、TCMET系统建构软体功能

TCMET使用软体

MICROSOFT WINDOW NT VERSION 4.0

  1. 建立WEB Server
  2. 建立Oracle Server

INTERNET INFORMATION SERVER ( IIS )

WEB Server各项Internet上通讯及安全设定

FRONT PAGE EXTENSION SERVER

Internet上网页编辑及设定

ACTIVE SERVER PAGE (ASP)

微软新一代的网页, 支援Server()-Client ()端程式设计、Active X

ORACLE DATABASE SERVER VERSION 7.3

主要提供TCMETInternet之中医药典籍资料库

MICROSOFT VISUAL FOXPRO VERSION 5.0

建立Oracle Server所须用之中医药典籍资料库

MICROSOFT INTERDEV VERSION 1.0

一个HomePageASP制作之整合及开发环境.

MICROSOFT ODBC FOR ORACLE

主从架构资料库之桥梁, ASP藉着SQL可直接呼叫Oracle DataBase中医药典籍资料, 在本系统中极为重要.

() 建立TCMET网站资料库

2.1景岳全书资料库

2.1.1文字档转换

  行政院卫生署中医药委员会于民国八十三年间已建置景岳全书文字档。当初之设计以篇、章、节等主题编入代码,方便电脑程式转换成资料库格式。本研究特别将景岳全书中之古方八阵及新方八阵共 2000 余个处方从新编码,各方之组成、主治功效及作者见解按照原作者编排方式,重新安排在网页上供网友阅览。

2.1.2建立黄帝内经、金元四大家、景岳全书2- 4各文献之全文检索资料库

  本研究依照2.1.1之方法,将文字档转换成资料库档。为节省使用者下载挡案之速度,本研究使用现今相当盛行之WINZIP压缩程式,对每一个检索文字档进行压缩。然后再编写程式将全文检索结果以文字档及压缩档方式储存在FTP ( ftp.tcmet.com.tw ) 伺服器上,供网友下载检索资料。

2.2 中医专有名词词库网页

2.2.1依中医药专有名词分类检索字汇

  本研究首创中医检索字汇分类表,例如外感六淫内容便包括了风、寒、暑、湿、燥、火等关键词,从过去两年之TCMET伺服器日志纪录案中,可得知网友使用此分类方法阅览资料之频率非常高。且网页中把每一个关键词在各文献中出现的频率详细列出,供使用者了解档案中字数量的大小。

2.2.2类证治裁名词资料库

  清.林佩琴类证治裁一书,于八十七年由陈建霖医师与笔者共同建置,本研究收录类证治裁200个中医专有名词及定义,经整理后之名词定义资料,分别放置在动态资料库网页表格中,使用者只要点选第一个栏位的号码,下一层的名词定义详细资料便会展开供网友阅览。

() TCMET系统架构

3.1建立ORACLE中医古籍文献资料库

  本研究之INTERNET资料库设计乃使用CLIENT-SERVER(主从架构)建置,如本文2.1节中所引用之中医古籍文献必须转换至ORACLE SERVER(资料库)方能使用。TCMET之档案资料库皆以关联式资料库结构存取,每一个表格都经过标准规格化,以三层标准形式(Third Normalization Form)建置5。在网页上CLIENT端之网友,只要用滑鼠(手形游标)点选网页或表格中之查询(QUERY)热键,TCMET WEB SERVER 接收到CLIENT传来信息后,便会以STRUCTURE QUERY LANGUAGE(SQL)程序读取资料库伺服器之资料。SQL是开发动态资料库的查询语言程序内含索引过滤功能(Filtering)ASP透过ODBC(见表一)直接送出SQL查询程序至ORACLE资料库,搜索系统便依据SQL指令查询(检索)资料库中之关联性表格,并将检索结果回传至网友网页上。

3.2建立网页伺服器(WEB SERVER)

  WEB SERVER是对外(INTERNET)及内之主要系统,是整个TCMET之心脏地带,在系统建构时必须考虑系统之存取速度、通讯速率、安全性及稳定性。确保一个易学易用,而且有效率的网站登录在全球资讯网路中,供全世界网友使用。

3.2.1 WEB通讯系统架构

  前述有关WEBORACLE SERVER之通讯皆籍由TCP/IP彼此联系。WEB SERVER架设在微软INTERNET INFORMATION SERVER(IIS 3.0)上,由ODBC可将ORACLE资料库资料直接读入网页中,ODBC之用途请参考表一之说明。而网页之设计是以微软之Active Sever Page(ASP) 建置,并且经由GateWay(通讯闸)送到INTERNET(见图一)

() 设计TCMET的基本资讯理念

  一个成功的电脑系统背后必定隐藏着许多建构的技巧与知识、决策及经验。一个成功的网际网路系统其必备条件是稳定、安全、内容丰富及速度快。换言之,系统的维修工作一定要做好,不能三、五天就“当”机。网际网路是一个对外开放的系统,内部及外部的资料一定要确保安全。目前本系统所有的文字档已经全部可以下载,因此文字部份并无加密之必要,但系统必须能防止写入,以免骇客更换或变动档案。TCMET已经将中医重要的经典著作二百余万字资料登录在本系统,并且分门别类列举在各表格中,这就是网际网路编排特色6,以方便使用者寻找资料。 另一个成功因素是要阅览速度够快,若要网友每切换一个主题或一页便要等很长的时间,除非资料很重要且档案很大,使用者觉得等一二天也会觉得值得,此情况下速度不是问题。 TCMET资料库之原始设计是尽可能分割资料以建立关联索引档7,并编列适当之栏位为主要键 (PRIMARY KEY),目的是要?加速度。 

4.1速度设计

  本研究所有网页上之物件,如动态资料表格( Dynamic Data Table) 、表格移动按钮(Navigation Button) 、网框及图案等,系统建构原则首先着重的就是速度,其次是资料库内容,最后才会考虑到美观动画的安排。一个成功资讯系统必要的条件是执行速度要够快,因此在系统设计时应尽量以减少系统所产生的等待时间(DOWN TIME ) 8,9为原则,今以TCMET网页中古方八阵为例加以说明“等待时间“之重要性。本研究将一个内含2000首方剂的古方八阵网页,分割成十三个子页并放置表格移动按钮(Navigation Button)供分页阅览,分割页与完整页(2000方)显示在网际网路上所相差的时间有10分钟之久,没有耐性等待之网友很多还未看到资料便随即结束执行程序。基于上述理由,本研究基本的网页设计观念是将同类资料集中作专案处理及速度够快。全文检索是本研究的重点,将检索结果显示在网页上,方式很多,为使检索资料能够集中处理,本研究将资料(黄帝内经、金元四大家及景岳全书)准备妥当,并建置了383个重要之中医关键词档和预作全文检索(2. 1.2)。研究计划初期并没有考虑要将全文检索资料集中处理,其后果是可想而知:网友若要在二百万字资料库中进行383个关键词即时(Real Time)检索,所需的时间可能要花上数周,真是一件耗时又没有效率的工作,简直是不可能的任务。因此立刻以专案方式重新评估,最后才决定在TCMET网站上把关键词分门别类建置在网页上,而且检索结果亦预先建档,当网友要DOWN LOAD(下载)资料时,等于适当资料已经找到,此时使用者等待的时间便取决于资料下载档案之大小,下载档大必然需要多一点时间,网友是可以接受的,亦等于解决了网站上即时检索的一大难题。将同类资料集中(全文检索)作专案处理,加速了网友找寻合适资讯的程序,使系统的成本效益(Cost Effectiveness)大大提升。图档会减慢网页的传输速度,专业的全文检索网页,增加美观的图形其功用只能点缀而已,本研究各网页中图档用得很少,也是为了速度考量之缘故。

4.2系统安全

  微软IIS 3.0的网际网路元件,有相当好的安全维护功能。一般使用者要侵入并不容易,而且本系统在网路上的资料也没有必要层层防护,但系统内部电脑资料当然是不会对外开放,微软NT 4.0 NTFS 档案系统架构有很好的保护功能,另外本系统有使用者的事件纪录,可追踪网站上各项活动。

4.3使用者介面

  网页主要组成可分为三类:()文字格式、()表格资料库格式及()网际网路下载档案格式。因为本研究要处理大量的中医古籍文献资料,为确保网友能够易学易用。网页结构最多不超过三层:第一层是首页、第二层是方剂或药物之标题、第三层是本文内容,这三层结构足以使中医古籍资料查询速度及深度皆可兼顾。

4.4网际网路动态资料库

管理及维护中医药古籍文献大量文字档资料,关联性资料库是一个可行而且有效率的方法4。本研究以Visual InterDev开发网际网路动态资料库10,网际网路动态资料库在ASP上可看作是个物件,经由ActiveX登录在网际网路伺服器上,而系统会依据动态资料库指令,能够让有授权之使用者在ASP上新增、修改、删除资料。研究初期曾经测试ORACLE资料库的效能,结果远在花莲之TCMET网路伺服器主要透过TCP/IP(3.2.1) ORACLE 网路通讯协定及ODBC之设定,可以直接连接到中医药委员会在台北之ORACLE 资料库。图二中所列举之主从架构资料库网页,便是以动态资料库在ASP下建置完成之范例。因着动态资料库的成功建置,所有在ASP表格中之TCMET文献查询资料,都是在InterDev上编写SQL语言程式(3.1)而产生,因为不需用人工方式逐页编写超文件标示语言(HTML) 程序,网页开发成本远比一般之HTML为低。

  本网站已于民国八十六年十二月成功登录在网际网路上,网站命名中医药典籍网际网路(TCMET),网址(HTTP:\\WWW.TCMET.COM.TW) 。文献系统架构亦于八十七年元月完成,八十七年六月研究告一段落,景岳全书全文检索包括:新、古方八阵共二仟余方及类证治裁等文献档亦成功设置完成。

  八十七年九月建置FTP:\\WWW.TCMET.COM.TW(档案下载)网站。本网站经由两年的统计己超过两万人次上网参观,并且下载及阅览资料库中医文献资料已超过五千万笔。初步统计分析东南亚如香港、新加坡、中国大陆、日本、欧洲如英国、荷兰、北美等国家经常有使用者上网。本网站亦已早在八十七年初登录在中文雅虎(并选为推荐网站)蕃薯藤等著名搜索引擎网站上。

 TCMET 首页,网友可以在首页中选择切入点,浏览合适之网页资料。若网友选择景岳全书本草学相关资料,网页经由ASP传递SQL信息给ORACLCE DATABASE, ORACLE则传回搜寻结果给ASP网页,这一种资料库架构称为CLIENT-SERVER(主从)结构模式(图二左)。例如当网友点选肝气以津之相关文献资料,电脑则重复主从结构模式,把文献中有关 肝气以津之详细内容供网友阅览(图二右)。本研究之中医关键词归类法是依专业的医用名词术语来作分类:如“四季津液”,中医专业人员便知道是春、夏、秋、冬、津、液等关键词,本研究提供了383 个常用之关键词索引。每个关键词在各种古籍文献出现之频率总笔数。例如当使用者按下“津”这个主词后,网页便经由主从资料库结构模式,显示所有相关文句。网页的最后一层则显示该文句前后五十句之内容供使用者阅览。全文索引结果已经预先存放在FTP:\\WWW.TCMET.COM.TW 之档案路径中。关键词档第110行会印出关键词在各文献中出现之频率,接着便是关键词相关文句前后各10句之内容,网友可直按下载索引结果,节省了很多线上查询所花费之时间,而且资料获得既快速又完整。另外本网页提供网友下载经整理后之中医古籍文献资料,一本景岳全书便有3086个章节之分类。以上所介绍的范例皆可以在WWW.TCMET.COM.TW 网页中获得,因论文篇幅所限,请读者自行上网便可以轻易找到相关范例。

图二 主从架构资料库网页范例

讨论

  网际网路是一项在九0年代的科学革命性技术,是空前之通讯科技;提供网友及程式设计师许多想像空间11,所以有“网路漫游”之新创名词。到底网际网路应该以何种形态设计比较好,迄今尚无定论。但有一点可以确定的是网页内容及基本资讯原理将成为建构一个成功网站的主要因素。在资讯设计原理中,系统之安全性、稳定性及速度在本研究中列入优先考虑课题。一个成功的网站当然是一个多人上网很热门的网址,若果有多人使用便有经济效益,没有效益的网站是没有存在之必要。由于本网站上网人次已累积2万余,而且有增加之趋势,对中医古籍之推广有历史性价值。然而一个网际网站之维护是件相当繁杂的任务,因为网页内容不能一成不变,每隔一年便应该更新及增加资料给广大网友使用,以提升网站之经济效益。另外必须面对的课题便是网站的安全,TCMET电脑系统也曾经受到骇客以“邮包炸弹”方式扰乱日记纪录档(Log File),由于本系统能侦察出寄件之来源,而第一道防线是立刻拒绝骇客的网址,也就是不让该网址连上TCMET 。本系统也有被盗取资料的情况,但因为所有的文字档皆已公开在FTP伺服器上供网友下载。因此,文字档资料当初便无意考虑设防,但系统安全性顾虑可见一斑。随着电脑硬体之急促发展,本系统已从原来的PENTIUM II升级至PENTIUM IIICPUPC,硬碟也更换了好几次。当初使用之ORACLE DATA BASE已换了MICROSOFT SQL SERVER。本系统所使用之ASP技术在网际网路上仍有许多盲点,必须不断研究,才能够追上时代。让中医古籍文献索引能够运用最新的网际网路技术提供一个安全、快速、稳定、可靠及内容丰富的网际网路环境给网友使用,可算是中医古籍网际网路开发者应追求之理想。

  中医古籍文献资料过去都是以文字档案格式建档,由于文字档并无关联功能,因此资料索引相当之呆板,资料库管理系统如ORACLE微软 SQL SERVER 都是对中医古籍文献索引的有效工具,因为关联档之设计可以使一层又一层的树状索引变得容易。网际网路资料库是发展TCMET 之灵魂,网际网路伺服器(WEB SERVER)则是心脏,而中医古籍文献资料是赖维生之营养。系统中各项程序环环相扣,只要一个步骤出错便可以立刻使网友终止资料库连结。当然不能忽略网际网路之内外接线也极为重要,只要来一个停电,系统便会瘫痪,可见资讯网路是很难管理的高科技产物。但人类在历史上从来没有机器能够全年无休为全球民众作互动沟通,直至网际网路之发明。因此只要能够克服困难掌握中医古籍网际网路建构技术,电脑便会全天候为工程人员及全球网友服务,而且很听使唤。各种网页图文、文献资料查询、关连档建置都可以集中管理,网友无远弗届,获得资讯在弹指间。

中国医学一向重视传统,黄帝内经虽然是秦汉(二千伍佰年前)之产物,但现今仍受到世界先进国家重视。把电子中医古籍文献重新排版整理,以符合网际网路的经济效益,将是电子中医古籍文献之重要任务。在电脑科技尚未盛行之际,要检索及整理中医药古籍文献真是一件苦差事。TCMET设置完成后,可算是第一套在中文雅虎上被推荐之中医药古籍动态资料库网站,本网站除实际使文献检索这件苦差事变得较为轻松外,网际网路更是无远弗届。网友都知道1999年的网际网路可以检索新闻报纸、圣经、历史藏书、科学期刊等不同领域的资料。十年前行政院中医药委员会已着手规划中医药古籍资讯化研究工作,把过去大量的中医药古籍文献电子资料连结在网际网路上,是中医药委员典籍资讯组交付的任务,虽然不完美但真的已做到了。由于本网站诞生只有2年之?月,在草创之初着重在全文检索及动态资料库系统之建立,许多网际网路功能如中医古籍索引讨论区、专家意见问答栏、药物图形资料库、声影资料库等皆有待加强,以建立一个完备而实用的TCMET网站。

  有感于建设资料库网际网路任务并不容易,且中医药古籍文献整理之困难, 目前本网站只收录到黄帝内经、金元四大家、景岳全书及部份类证治裁等书籍,共二佰余万字在TCMET网站,还有成千上万中医药古籍文献等着整理增加到网路上,期盼更多学者专家共同投入研究为传统中国医学尽一点时代性的责任。

谢 辞

承蒙行政院中医药委员会87年度经费补助研究计划,网际网路中医古籍文献检索系统──景岳全书(CCMP87IP01)。委员会典籍资讯组林弘基组长及许秀锦技正提供电脑软体相助,使系统得以顺利建置。慈济医院中医部曾国烈主任、陈建霖陈乃菁二位医师及科内同仁协助整理中医药典籍资料,让景岳全书之方剂及本草学得以表格化。衷心感谢。

 

参考文献

  1. DomainStats.Com(1999). Internet Domain Survey, Sept, 1999. [Online]. Available: WWW URL
  2. http://www.domainstats.com.

  3. Yat-Kowng Chan, Kuan-Chung Su, Tsang-Shyh Li.中医药典籍整合电脑系统(III),行政院卫生
  4. 署中医药年报,13(3): 407-408, 1996

  5. 陈逸光、方荣瑞 ,中医文献电脑资讯化研究──黄帝内经,行政院卫生署中医药年报,9: 344-3641991
  6. 陈逸光, 中医古籍文献资讯化研究, 国际中医药资讯典籍学术研讨会论文集(台中)pp.
  7. 195-2041997

  8. RS Dick , EB Steen. The Computer-Based Patient record. National Academy Press, Washington, D.C., pp. 56-60, 1991.
  9. F. Wingert. An Indexing System for SNOMED. Methods of Information in Medicine. 25: 22-30,
  10. 1986.

  11. A Rector, A Rossi. Practical development of re-usable terminologies : GALEN-IN-USE and the
  12. GALEN Organization. International Journal of Medical Informatics. 48(1-3): 71-84, 1998.

  13. LE Perreault, G Wiederhold. System Design and Evaluation, In: Medical Informatics. Addison-

Wesley publishing company, Massachusetts, pp. 172-177, 1990.

9. Mike Fratto. NT remote-access servers: Ready for the big league?. Network Computing, Manhasset.

9(3):108-109, 1998.

10. Mike Morrison, Using the ActiveX Data Objects, In: Using Microsoft Visual Interdev . QUE

corporation, Indianapolis, pp 593-613, 1997.

11. JG Faughnan, R Elson. Information technology and the clinical curriculum: some predictions and

their implications for the class of 2003. Academic Medicine 73(3) : 766-769, 1998.