鱷魚眼淚范文
時(shí)間:2023-03-22 23:31:05
導(dǎo)語:如何才能寫好一篇鱷魚眼淚,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
1、鱷魚眼淚:傳說鱷魚在吞食人畜時(shí),邊吃邊流眼淚。比喻惡人的假慈悲。例句:他終于擠出了幾滴鱷魚眼淚。
2、鯨波鱷浪:猶驚濤駭浪。出自清代南荃居士的《海僑春傳奇·瘋訴》:望鯨波鱷浪連天涌,莽天涯沓沓蒙蒙。
(來源:文章屋網(wǎng) )
篇2
【關(guān)鍵詞】主題爬蟲;特征提取;文本分類;向量空間模型
1.引言
隨著互聯(lián)網(wǎng)的大規(guī)模普及和各行業(yè)信息化程度的提高,與行業(yè)領(lǐng)域相關(guān)的Web文本信息快速積累,如何從這些海量信息中定向提取符合需要的知識(shí),是當(dāng)前信息處理研究領(lǐng)域的一個(gè)研究熱點(diǎn),該問題涉及到對(duì)領(lǐng)域Web文本信息的采集和對(duì)采集到的信息進(jìn)行處理和數(shù)據(jù)挖掘兩方面的內(nèi)容。在采集領(lǐng)域相關(guān)網(wǎng)頁(yè)的過程中,主題描述及網(wǎng)頁(yè)內(nèi)容的相關(guān)性判斷,都需要用到文本預(yù)處理技術(shù),信息采集成功后,又需要通過文本預(yù)處理和分類技術(shù)對(duì)領(lǐng)域文本進(jìn)行分類。本文對(duì)系統(tǒng)設(shè)計(jì)中的一些關(guān)鍵問題進(jìn)行了研究,并以機(jī)械領(lǐng)域挖掘機(jī)為主題,實(shí)現(xiàn)了一個(gè)機(jī)械領(lǐng)域Web文本采集與分類原型系統(tǒng)。
2.主題爬蟲的主題確立
對(duì)領(lǐng)域Web文本的采集,其實(shí)質(zhì)就是設(shè)計(jì)針對(duì)某一領(lǐng)域的網(wǎng)絡(luò)爬蟲。專業(yè)領(lǐng)域用戶一般只關(guān)心與其領(lǐng)域相關(guān)的一些資源,垂直搜索,專精化,行業(yè)化。主題爬蟲技術(shù)可根據(jù)一定的分析方法和搜索策略,選擇性的獲取與主題相關(guān)的Web頁(yè)面。主題爬蟲系統(tǒng)一般包括種子模塊、主題確立模塊、爬蟲爬行模塊和主題相關(guān)性分析模塊四個(gè)部分。設(shè)計(jì)高質(zhì)量主題爬蟲的關(guān)鍵問題是如何保證抓取的網(wǎng)頁(yè)中與主題無關(guān)的網(wǎng)頁(yè)盡可能的少,對(duì)待抓取的主題的準(zhǔn)確描述是設(shè)計(jì)主題網(wǎng)絡(luò)爬蟲的首要任務(wù),也是一項(xiàng)關(guān)鍵任務(wù),這點(diǎn)對(duì)于主題相關(guān)性判斷影響重大。常用的主題描述方法一般有兩種,一種是根據(jù)人工經(jīng)驗(yàn),由用戶直接給出一組關(guān)鍵字來描述主題,這種方式簡(jiǎn)單,也比較準(zhǔn)確,但是對(duì)用戶的專業(yè)領(lǐng)域知識(shí)要求較高。
另外,當(dāng)知識(shí)更新較快時(shí),極有可能出現(xiàn)漏選的情況。另一種方法為主題代表性文檔特征抽取。通過用戶提供或者選擇一些相關(guān)主題的實(shí)例文檔,由爬蟲從中提取用戶主題,其實(shí)質(zhì)是通過學(xué)習(xí)相關(guān)領(lǐng)域文檔并進(jìn)行自動(dòng)特征提取的過程。優(yōu)點(diǎn)是定義精確,但要求所選取的文檔和頁(yè)面必須具有代表性和概括性,否則可能出現(xiàn)偏差。
3.網(wǎng)頁(yè)正文提取研究
網(wǎng)頁(yè)正文提取是網(wǎng)頁(yè)解析模塊的一個(gè)難點(diǎn),也是最為核心的部分。大多數(shù)網(wǎng)頁(yè)中除了包含有用信息(正文)外,還包含網(wǎng)站導(dǎo)航信息、廣告、腳本語言等許多噪聲信息,如果提取不當(dāng),則提取結(jié)果可能慘不忍睹,根本沒有使用價(jià)值。只有真正提取出的正文文本,才是最有價(jià)值的,后續(xù)的網(wǎng)頁(yè)相關(guān)性判別和網(wǎng)頁(yè)文本分類才更加準(zhǔn)確。
目前已存在一些網(wǎng)頁(yè)正文提取的方法,比較典型的有基于Dom樹;基于數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí);基于模板、規(guī)則;基于網(wǎng)頁(yè)內(nèi)容分塊等。Dom樹方法雖直觀有效,但其樹的建立,要求html必須合乎規(guī)范,且時(shí)空復(fù)雜度高,樹的遍歷方法也不具通用性,需根據(jù)html標(biāo)簽的不同而變化。用數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)的方法來解決該問題,又把簡(jiǎn)單問題復(fù)雜化了。總體來說,這些方法大多不具備通用性,或?qū)崿F(xiàn)起來較為復(fù)雜,準(zhǔn)確度不高。
4.領(lǐng)域文本分類
領(lǐng)域文本具有不同于普通文本的特點(diǎn)。1)分詞困難。領(lǐng)域文本專業(yè)性較強(qiáng),常常包含大量的專業(yè)詞匯,這使得領(lǐng)域文本的分詞較普通文本而言更具復(fù)雜性。如何設(shè)計(jì)分詞算法,使得專業(yè)詞匯能夠盡可能小的不被劃分開來,對(duì)后續(xù)操作影響重大。通過設(shè)計(jì)專業(yè)詞庫(kù)可以解決這一問題。專業(yè)詞庫(kù)的制定應(yīng)確保其權(quán)威性和完整性。本文中所采用的機(jī)械專業(yè)詞庫(kù)中的詞條主要來源于機(jī)械專業(yè)詞典、由機(jī)械設(shè)計(jì)制造研究人員收工錄入,還有部分來源于搜狗實(shí)驗(yàn)室,經(jīng)過選擇,去重得到的。2)已標(biāo)記樣本較少。在機(jī)械類別的文本中,由于沒有通用的用于機(jī)械領(lǐng)域文本分類研究的實(shí)驗(yàn)語料,本研究主要的語料來源為主題爬蟲程序所采集到的網(wǎng)頁(yè)文本,一部分專業(yè)文檔資料和少量電子版用戶需求文檔。
5.領(lǐng)域web文本采集與挖掘系統(tǒng)設(shè)計(jì)
根據(jù)上述研究?jī)?nèi)容,本文設(shè)計(jì)了一個(gè)面向機(jī)械領(lǐng)域產(chǎn)品用戶需求信息的web文本采集與挖掘系統(tǒng)。系統(tǒng)結(jié)構(gòu)如圖1所示。
5.1 機(jī)械產(chǎn)品信息的主題描述
本系統(tǒng)主題描述步驟如下:
Step1.由領(lǐng)域?qū)<胰斯そo出一組主題詞及其對(duì)應(yīng)權(quán)值(t1,ω1:t2,ω2:……:tn,ωn)。本文附錄給出了一個(gè)由領(lǐng)域研究人員提供的機(jī)械領(lǐng)域?qū)I(yè)關(guān)鍵詞庫(kù),可以直接從里面篩選。
Step2.收集有代表性的主題相關(guān)度較高的文本文檔,進(jìn)行文本預(yù)處理,采用向量空間模型將文本表示出來,對(duì)這些文本資料進(jìn)行特征選擇,獲得共同擁有的特征作為主題特征詞集合。這里的特征選擇方法采用基于關(guān)聯(lián)規(guī)則的專業(yè)特征選擇方法,通過改進(jìn)的灰色關(guān)聯(lián)公式進(jìn)行關(guān)聯(lián)度計(jì)算將多個(gè)文檔表示信息組合在一起,計(jì)算非專業(yè)術(shù)語與專業(yè)術(shù)語的灰色關(guān)聯(lián)度,獲得專業(yè)術(shù)語的關(guān)聯(lián)度矩陣;對(duì)關(guān)聯(lián)度矩陣進(jìn)行加權(quán)計(jì)算,提取出需求的專業(yè)術(shù)語得到專業(yè)的需求描述。
Step3.爬蟲程序根據(jù)主題詞ti進(jìn)行爬行,采集與之相關(guān)的網(wǎng)頁(yè),對(duì)這些網(wǎng)頁(yè)進(jìn)行文本特征提取,選擇出權(quán)重高的特征詞,判斷是否已包含在專業(yè)特征詞庫(kù)中,若沒有,則加入專業(yè)特征詞庫(kù)。即更新主題候選詞集。
Step4.將得到的主題詞存放在topic.txt中。
通過以上步驟,得到主題特征。整個(gè)過程是一個(gè)不斷學(xué)習(xí)更新的過程,從而實(shí)現(xiàn)對(duì)主題詞集合的不斷擴(kuò)充,提高主題描述的精確度。
5.2 頁(yè)面采集模塊
通過HTTP,HtmlParser,Parser類對(duì)從待爬隊(duì)列waitingQueue取得的URL對(duì)應(yīng)的網(wǎng)頁(yè)解析,得到網(wǎng)頁(yè)上的所有鏈接并通過循環(huán)對(duì)鏈接對(duì)應(yīng)的網(wǎng)頁(yè)解析。首先通過MannerGahter類進(jìn)行禮貌采集判斷,服務(wù)器允許采集則可解析出網(wǎng)頁(yè)上的對(duì)應(yīng)P標(biāo)簽和Title標(biāo)簽的文檔信息,然后通過Segment類對(duì)文檔分詞。
對(duì)標(biāo)題及正文的特征項(xiàng)的選取是通過分詞后與主題集合匹配,并通過詞頻計(jì)算特征選擇來得到與主題向量維數(shù)相等的標(biāo)題向量和正文向量。
計(jì)算相關(guān)性。首先公式1計(jì)算兩個(gè)表示文本的向量之間的相似度。
公式1
分別計(jì)算出主題和標(biāo)題、主題和正文的相關(guān)度,然后標(biāo)題與正文以4:1的比重計(jì)算出整個(gè)網(wǎng)頁(yè)與主題的相關(guān)度,即4*主題和標(biāo)題的相關(guān)度+1*正文與主題相關(guān)度。通過詳細(xì)計(jì)算,設(shè)定相關(guān)度閾值為75%,網(wǎng)頁(yè)與主題的相關(guān)度大于75%則認(rèn)為該網(wǎng)頁(yè)是與主題相關(guān)的。最后系統(tǒng)運(yùn)行界面如圖2所示。
6.結(jié)語
本文探討了面向領(lǐng)域的Web文本采集與分類問題,對(duì)主題網(wǎng)絡(luò)爬蟲設(shè)計(jì)中的主題確定,種子URL選擇、相關(guān)性分析、網(wǎng)頁(yè)解析與正文提取和搜索策略等問題予以研究,分析行業(yè)領(lǐng)域文本的特點(diǎn),進(jìn)行恰當(dāng)?shù)闹黝}描述,選擇KNN算法來構(gòu)造領(lǐng)域文本分類器,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)機(jī)械主題Web文本采集與分類原型系統(tǒng)。
參考文獻(xiàn)
[1]J.Han et al..Mining frequent patterns without candidate generation.In Proceedings of the 2000 ACM SIGMOD Conference on Management of Data,Dallas,TX,2000:1-12.
[2]魏松,鐘義信,王翔英.中文Web文本挖掘系統(tǒng)WebTe-xtMiner開發(fā)[J].計(jì)算機(jī)應(yīng)用研究,2005(6)211-213.
[3]沈記全,唐菁,楊炳儒.Web文本挖掘系統(tǒng)及其分類算法的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)工程,2009.03(2):13-14.
[4]CHAKRABARTI S,BERG DEN VAN M.Focused Crawling:A new approach to Topic-Specific Web Resourse Discovery[C].In Proceedings of the 8th International WWW conference,Toronto,Canada,1999.
[5]劉國(guó)靖,康麗,羅長(zhǎng)壽.基于遺傳算法的主題爬蟲策略[J].計(jì)算機(jī)應(yīng)用,2007,27(12):172-179.
[6]Chakrabati S,Punera K,Subram anyam M.Accelerated focused crawling through online relevance feedback,WWW2002,May 7-11,2002,Honolulu,Hawaii,USA.http//csberkeley.edu/-soumen/doc/www2002m/p336-chakrabarti.pdf(Accessed Nov.8,2006)
[9]M.Ehrig,A.Maedche.Ontology-focused Crawling of Web Documents.In Proceedings of the 2003 ACM symposium on Applied computing,Melbourne,F(xiàn)lorida,June 2003:1174-1178.
篇3
你好!
在茫茫的人生海洋上,會(huì)遇到無數(shù)挫折,你像一艘船,乘風(fēng)破浪,勇敢向前。
但最近你遇到了海上的一簇暗礁,你停止了行進(jìn),陷入了沉思。事情是這樣的:黑板報(bào)的組長(zhǎng)——你,有權(quán)力管組員,組員分配好了,但沒有人把水倒掉,你隨便點(diǎn)了一位同學(xué)把水倒掉,那個(gè)矮矮胖胖的袁斌就是不倒。當(dāng)老師走進(jìn)教室,見一桶臟水在墻角,就厲聲問:“金瀟逸,這是怎么回事?”你惱怒地說:“袁斌,他~”袁斌當(dāng)場(chǎng)抵賴,無奈無辜的你又遭老師訓(xùn)斥:“為什么沒倒掉,你身為組長(zhǎng),沒有分配好!即使袁斌不倒,你也可以倒掉!”你氣得似狂怒的獅子,兩滴委曲的淚珠兒滑落下來,袁斌卻露出狡獪的笑。
朋友,不要煩惱,惡人會(huì)有惡報(bào)的!放開心胸,讓小船重新啟航,重新啟航!這只是生活中一個(gè)小小的挫折,讓它遠(yuǎn)去吧!遼遠(yuǎn)的人生之海,等待你的挑戰(zhàn)!
瞧,你的學(xué)習(xí)成績(jī)不是很好嘛!袁斌和你比真是天差地別,他是個(gè)無賴,以干壞事出名,不要跟他賭氣,放開點(diǎn)兒吧,朋友。
那艘船仍行駛在生活之海中,忽然,海上刮起一陣風(fēng),掀起的浪花搖動(dòng)著船身,原來勇敢的你被風(fēng)的巨大和海的氣魄所壓抑,你又一次停止了行進(jìn)……
王超是班上有名的“傻蛋”,眼睛一大一小,身上有股狐臭,是班中的“臭屁精”。你,是班上的“諸葛亮”,學(xué)習(xí)甭說,身體也不錯(cuò),就是喜歡和人對(duì)峙,愛把事弄得亂七八糟。可這卻招來“天災(zāi)”,王超竟主動(dòng)和你交手,他還有個(gè)綽號(hào)“罵人王”,你怎能和這種人接軌???他罵人時(shí)總把人罵個(gè)狗血淋頭,而且用魯迅的那套“罵法”罵人,把人罵哭了,還說他(她)是鱷魚眼淚,我看他把學(xué)習(xí)的力氣都用在罵人上了!你準(zhǔn)備戰(zhàn)斗,上課時(shí),他輕輕地罵你,你馬上重重地反擊,卻被教師叫住,說‘上課不許交頭接耳’,你冤啊,很冤啊!!!卻是啞巴吃黃連——有苦難言。其實(shí),你也有錯(cuò),這能怪誰呢?你為什么不能控制自己呢?這也是一個(gè)生活插曲,一個(gè)小小的挫折,你挺過去了。
海上風(fēng)停了,浪退了,金黃的太陽(yáng)射出萬丈光芒,你又哼著歌兒遠(yuǎn)行!你知道前面還會(huì)有暗礁,有旋渦,但我相信你定會(huì)有勇氣闖過去,去迎接光輝燦爛的明天!
祝你:
快樂,永遠(yuǎn)快樂!
你的朋友:影子
篇4
關(guān)鍵詞:數(shù)據(jù)挖掘;簇;聚類算法
中圖分類號(hào):TP301.6文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-7800(2012)010-0033-03
基金項(xiàng)目:湖南省大學(xué)生研究性學(xué)習(xí)和創(chuàng)新性實(shí)驗(yàn)計(jì)劃項(xiàng)目(JSU-CX-2011-28)
作者簡(jiǎn)介:張露(1991-),女,吉首大學(xué)軟件服務(wù)外包學(xué)院學(xué)生,研究方向?yàn)橛?jì)算機(jī)科學(xué);張彬連(1978-),女,吉首大學(xué)軟件服務(wù)外包學(xué)院講師,研究方向?yàn)橛?jì)算機(jī)科學(xué)。
0引言
隨著信息和科學(xué)技術(shù)的高速發(fā)展,各行業(yè)積累的數(shù)據(jù)量迅速增長(zhǎng),而更重要的是如何從大量的、不完全的數(shù)據(jù)中提取出有用的信息。而在數(shù)據(jù)挖掘中充當(dāng)重要角色的就是聚類,它在識(shí)別數(shù)據(jù)的內(nèi)在結(jié)構(gòu)方面具有獨(dú)到的作用。而數(shù)據(jù)挖掘工具以及工具提供的可選擇的算法是實(shí)現(xiàn)數(shù)據(jù)挖掘目的的墊腳石。數(shù)據(jù)的類型、聚類的目的應(yīng)用決定了選擇哪一類聚類算法,其中聚類是把物理或者抽象對(duì)象分組成為由類似對(duì)象構(gòu)成的多個(gè)簇的過程,即把數(shù)據(jù)對(duì)象分成多個(gè)類或簇,在同一個(gè)簇中的對(duì)象具有較高的相似度,而不同簇中的對(duì)象差異較大。它對(duì)未知數(shù)據(jù)的分析和劃分能起到非常有效的作用。此外,通過聚類,能夠識(shí)別密集和稀疏的區(qū)域,發(fā)現(xiàn)全局的分布模式,以及數(shù)據(jù)屬性之間的相互關(guān)系等。為了找到效率高、通用性強(qiáng)的聚類方法,人們從不同角度提出了許多種聚類算法,大致可分為層次方法、劃分方法、基于密度的方法、基于網(wǎng)格的方法和基于模型的方法這五大類。
1典型聚類算法分類及其優(yōu)缺點(diǎn)分析
1.1基于劃分的聚類算法
首先,給定一個(gè)樣本為n的數(shù)據(jù)集,然后根據(jù)給定要?jiǎng)?chuàng)建劃分的數(shù)目k,將數(shù)據(jù)劃分為k個(gè)組(kn),每個(gè)組相應(yīng)地表示一個(gè)簇,同時(shí)滿足以下的條件:①每個(gè)組至少包含一個(gè)樣本;②每個(gè)樣本屬于且僅屬于一個(gè)簇。算法要事先給出要?jiǎng)?chuàng)建的劃分的數(shù)目k,創(chuàng)建一個(gè)初始劃分,然后采用循環(huán)定位技術(shù),通過根據(jù)簇類之間的差異把對(duì)象從一個(gè)劃分移動(dòng)到另一個(gè)劃分的方法來改善劃分質(zhì)量。評(píng)價(jià)劃分的好壞的標(biāo)準(zhǔn)一般是在同一個(gè)類中的對(duì)象盡可能“接近”,而不同類中的對(duì)象盡可能“遠(yuǎn)離”。為達(dá)到全局最優(yōu)的目的,基于劃分的聚類會(huì)要求窮舉所有可能的劃分。其中包括以下典型的劃分方法:k-平均、k-中心點(diǎn)、CLARA、CLARANS等。
1.1.1基于簇的重心技術(shù):k-平均算法
(2)k-平均算法的優(yōu)缺點(diǎn):①優(yōu)點(diǎn):當(dāng)滿足結(jié)果簇是緊湊的,并且簇與簇之間明顯分離式的前提條件,k-平均算法能發(fā)揮較好的效果,而且在處理大數(shù)據(jù)集時(shí),是有相對(duì)可伸縮的和有效率的;②缺點(diǎn):該算法有其限制條件,只有在簇的平均值被定義的基礎(chǔ)上才能使用,這就使得可能不適應(yīng)某些應(yīng)用的數(shù)據(jù),要求用戶必須事先給出k的取值。在大部分實(shí)際應(yīng)用中,最終的聚類數(shù)量并不能得到一個(gè)確切的數(shù)目,且該算法遇到非凸面形狀的簇,或者遇到在大小上存在很大差別的簇時(shí),聚類效果不明顯。而且,它對(duì)于帶有“噪聲”的空間數(shù)據(jù)和離群數(shù)據(jù)是敏感的。該算法經(jīng)常止于局部最優(yōu)。
1.1.2基于有代表性的對(duì)象的技術(shù):k-中心點(diǎn)方法
1.1.3基于選擇的k-中心點(diǎn)CLARANS方法
(1)CLARANS方法的處理流程:首先,不考慮整個(gè)數(shù)據(jù)集合,用實(shí)際數(shù)據(jù)的抽樣來作為數(shù)據(jù)的樣本;然后,用PAM方法從樣本中選擇中心點(diǎn);返回最好的聚類結(jié)果作為輸出。
(2)CLARANS方法的優(yōu)缺點(diǎn):①優(yōu)點(diǎn):該算法的效率較高,能夠發(fā)現(xiàn)最“自然的”結(jié)果簇?cái)?shù)目,且能夠檢測(cè)離群點(diǎn),且相應(yīng)地拓展了數(shù)據(jù)處理量的伸縮范圍;②缺點(diǎn):該方法的聚類質(zhì)量對(duì)采取的抽樣方法依賴性強(qiáng),且最中心點(diǎn)的要求較高。而且對(duì)于大數(shù)據(jù)量、時(shí)間復(fù)雜度和空間復(fù)雜度都很大。
1.2基于層次的聚類算法
根據(jù)樹的形成過程,層次分解的方向的不同可以分為以下兩種類型:
(1)自底向上(凝聚)聚類方法。該方法一開始將每個(gè)對(duì)象作為單獨(dú)的一個(gè)組,然后繼續(xù)與相近的對(duì)象或組合并,直到所有單獨(dú)的組都被合并,成為一個(gè)整體,或者達(dá)到一個(gè)終止條件。
(2)自頂向下(分裂)聚類方法。與凝聚法相反,該策略先將所有對(duì)象置于一個(gè)簇中,在迭代的每一步中,在一個(gè)簇的基礎(chǔ)上分裂為更小的簇,直到最終每個(gè)單獨(dú)的簇中包含一個(gè)對(duì)象,或者達(dá)到一個(gè)終止條件。下面介紹其代表算法。
1.2.1BIRCH算法
(1)BIRCH算法包括階段:階段一是BIRCH掃描數(shù)據(jù)庫(kù),建立初始化的CF樹,嘗試把數(shù)據(jù)內(nèi)在的聚類結(jié)構(gòu)保留下來;階段二是BIRCH算法采用某個(gè)聚類算法對(duì)CF樹的葉節(jié)點(diǎn)進(jìn)行聚類。
(2)BIRCH算法的優(yōu)缺點(diǎn):①優(yōu)點(diǎn):引入的聚類特征樹概括了聚類的有用信息,且占用空間較元數(shù)據(jù)集合小,只需要一次性訪問數(shù)據(jù)庫(kù),速度快,伸縮性好,對(duì)增量或動(dòng)態(tài)聚類也非常有效,不需要大量遞歸運(yùn)算。②缺點(diǎn):由于CF樹每個(gè)節(jié)點(diǎn)的大小受限制,并不總是對(duì)應(yīng)于用戶所認(rèn)為的一個(gè)自然聚類,而且算法的工作效率依賴于簇的球形要求。
1.2.2CURE算法
(1)CURE算法工作原理:選擇了屬于聚合方法和分解的中間做法。選擇數(shù)據(jù)空間中具有代表性的點(diǎn)。且在選擇簇中分散的對(duì)象中產(chǎn)生一個(gè)簇的代表點(diǎn),然后根據(jù)一個(gè)特定的分?jǐn)?shù)或者收縮因子向簇心“收縮”或移動(dòng)它們。
(2)CURE算法優(yōu)缺點(diǎn):①優(yōu)點(diǎn):能識(shí)別非球狀以及大小不一的聚類,能更好地處理孤立點(diǎn)。對(duì)于大型的數(shù)據(jù)庫(kù),它也具有良好的伸縮性,且不影響聚類的質(zhì)量;②缺點(diǎn):聚類結(jié)果容易受到參數(shù)設(shè)置的影響,且CURE算法對(duì)分類屬性不進(jìn)行處理工作。
1.3基于密度的聚類算法
基于密度的聚類算法并不是基于各種各樣的距離而是基于密度的。這樣就能克服基于距離的算法只能發(fā)現(xiàn)“圓形”類的缺點(diǎn),它可以發(fā)現(xiàn)任意形狀類的聚類結(jié)果。該方法的思想就是,只要一個(gè)區(qū)域中的點(diǎn)的密度大于某個(gè)閾值,就把它加到與之相近的聚類中。以下介紹其代表算法DBSCAN算法和OPTICS算法。
1.3.1DBSCAN算法
(1)DBSCAN算法思想:首先通過檢查數(shù)據(jù)庫(kù)中每個(gè)點(diǎn)的ε-鄰域內(nèi)的鄰居點(diǎn)數(shù)衡量改點(diǎn)所在空間的密度。來尋找聚類。如果一個(gè)點(diǎn)p的ε-鄰域名超過某個(gè)指定閾值MinPts個(gè)點(diǎn),則建一個(gè)新簇以p作為核心對(duì)象,然后再反復(fù)地尋找從這些核心對(duì)象直接密度可達(dá)的對(duì)象,當(dāng)沒有新的點(diǎn)可以被添加時(shí),該過程即結(jié)束。
(2)DBSCAN算法優(yōu)缺點(diǎn):①優(yōu)點(diǎn):能夠把具有足夠高密度的區(qū)域劃分為簇,對(duì)帶有“噪聲”的空間數(shù)據(jù)比較敏感,可以發(fā)現(xiàn)任意形狀的聚類;②缺點(diǎn):參數(shù)的設(shè)置難以確定,對(duì)參數(shù)值是非常敏感的,容易導(dǎo)致誤差很大的聚類結(jié)果,且全局密度參數(shù)不能刻畫其內(nèi)在的聚類結(jié)構(gòu)。
1.3.2OPTICS算法
(1)OPTICS算法思想:采用影響函數(shù),即用一個(gè)數(shù)字函數(shù)來形式化地模擬每個(gè)數(shù)據(jù)點(diǎn)的影響;所有數(shù)據(jù)點(diǎn)的影響函數(shù)的總和可以由數(shù)據(jù)空間的整體密度模型化得到;可以通過確定密度吸引點(diǎn)來得到聚類,且此時(shí)全局密度函數(shù)在密度吸引點(diǎn)達(dá)到局部最大。
(2)OPTICS算法優(yōu)缺點(diǎn):①優(yōu)點(diǎn):該算法的數(shù)據(jù)基礎(chǔ)非常堅(jiān)實(shí),并且概括了其他的聚類算法;其良好的聚類特性在處理有大量“噪聲”的數(shù)據(jù)集合時(shí)充分體現(xiàn)出來了;提供了簡(jiǎn)單而有效的數(shù)學(xué)技術(shù)給高維數(shù)據(jù)集合的任意形狀的聚類;速度較快;②缺點(diǎn):聚類結(jié)果會(huì)容易受到密度參數(shù)和噪聲閾值等參數(shù)的影響。
1.4基于網(wǎng)格的聚類算法
基于網(wǎng)格的聚類方法采用的數(shù)據(jù)結(jié)構(gòu)是一個(gè)多分辨率的網(wǎng)格。它將數(shù)據(jù)空間分為有限數(shù)目的單元,形成網(wǎng)結(jié)構(gòu),所有的處理對(duì)象是單個(gè)的數(shù)據(jù)單元,這種處理方法與目標(biāo)數(shù)據(jù)庫(kù)中記錄的個(gè)數(shù)并不存在很大的關(guān)系。以下介紹其中的STING算法。
(1)STING算法工作原理:STING是一種基于網(wǎng)格的多分辨率聚類技術(shù),它將空間區(qū)域劃分為矩形單元,通常存在多個(gè)級(jí)別的矩形單元,這些單元形成了一個(gè)層次結(jié)構(gòu):高層的每個(gè)單元由多個(gè)低一層的單元組成,且事先計(jì)算和存儲(chǔ)關(guān)于每個(gè)網(wǎng)格單元屬性的統(tǒng)計(jì)信息,在查詢處理時(shí)就能使用這些統(tǒng)計(jì)參數(shù),達(dá)到不一樣的效果。
(2)STING算法優(yōu)缺點(diǎn):①優(yōu)點(diǎn):基于網(wǎng)格的計(jì)算與查詢是相對(duì)獨(dú)立的;在處理數(shù)據(jù)和增量更新方面能夠更加方便;效率較高;②缺點(diǎn):最底層的粒度影響算法的質(zhì)量,且該算法在構(gòu)建一個(gè)父單元時(shí),忽略了子單元與相鄰單元間的關(guān)系,導(dǎo)致結(jié)果簇的形狀的邊界不穩(wěn)定。
1.5基于模型的聚類算法
基于模型的聚類算法嘗試優(yōu)化給定的數(shù)據(jù)和某些數(shù)學(xué)模型之間的適應(yīng)性,是基于“數(shù)據(jù)是根據(jù)潛在的概率分布生成的”這一假設(shè)而提出的。該方法主要包括統(tǒng)計(jì)學(xué)方法和神經(jīng)網(wǎng)絡(luò)方法這兩大類。以下介紹其中的COBWEB算法。
(1)COBWEB算法工作原理:COBWEB算法采用分類屬性-值對(duì)來描述其輸入對(duì)象,以一個(gè)分類樹的形式來構(gòu)造層次聚類,并且在啟發(fā)式估算度量方法以及分類效用的指導(dǎo)下開展樹的構(gòu)建工作。
(2)COBWEB算法優(yōu)缺點(diǎn):①優(yōu)點(diǎn):對(duì)劃分過程中類的數(shù)目能自動(dòng)修正,不需要用戶提供這樣的輸入?yún)?shù),可以找到分類對(duì)象的最好結(jié)點(diǎn);②缺點(diǎn):該算法基于的“每個(gè)屬性上的概率分布式彼此獨(dú)立的”假設(shè)不總是成立的;更新和存儲(chǔ)聚類代價(jià)相當(dāng)高,可能導(dǎo)致時(shí)間和空間復(fù)雜性發(fā)生劇烈的變化。
2結(jié)語
分層聚類的突出亮點(diǎn)是它能夠生成比較規(guī)整的類集合,聚類結(jié)果不依賴元素的初始排列或輸入次序,與聚類過程的先后次序并沒有直接的關(guān)系,聚類結(jié)果相對(duì)穩(wěn)定,不易導(dǎo)致類的重構(gòu)。但它也存在著部門缺點(diǎn),如計(jì)算開銷較大,對(duì)異常數(shù)據(jù)比較脆弱。劃分聚類的優(yōu)點(diǎn)是運(yùn)算量小,能運(yùn)用于處理龐大的樣本數(shù)據(jù),也為實(shí)時(shí)處理提供了一定的可能性。但要求用戶必須預(yù)先給出聚類的參數(shù),還要靠度量函數(shù)來判定所給出解的優(yōu)劣程度。網(wǎng)格聚類處理速度快,處理時(shí)間與數(shù)據(jù)對(duì)象的數(shù)目無關(guān),聚類時(shí)間獨(dú)立于數(shù)據(jù)規(guī)模和數(shù)據(jù)次序,伸縮性極好。缺點(diǎn)是只能發(fā)現(xiàn)邊界是水平或垂直的聚類,不能檢測(cè)到斜邊界,也不適用于高維情況,并存在量化尺度的問題。密度聚類多用于時(shí)空信息處理、消除奇異值,并且可以在帶有“噪聲”的空間數(shù)據(jù)庫(kù)中發(fā)現(xiàn)形狀任意、個(gè)數(shù)不定的聚類,適合大型、高維數(shù)據(jù)集等方面具有較好的特性。對(duì)于所提到的上述聚類算法,可以從可伸縮性、處理不同類型屬性的能力、發(fā)現(xiàn)任意形狀的簇、處理噪聲數(shù)據(jù)的能力、對(duì)輸入順序的敏感性、處理高維數(shù)據(jù)的能力、需要決定的輸入?yún)?shù)最少以及對(duì)輸入記錄順序不敏感這些方面來進(jìn)行比較分析,以更好地了解這些聚類算法。
參考文獻(xiàn):
[1]HUANGZX,MICHAELK.Anoteonk-modesclustering[J].JournalogClassification,2003(2).
[2]PELLEGD,MOOREA.X-meansextendingk-meanswithefficientestimationofthenumberoftheclusters[C].Proceedingsofthe17thIC-ML,2000.
[3]ERTOZL,STEINBACHM,KUMARV.Findingclustersofdifferentsizes,shapesanddensitiesinnoisy,highdinensionaldata[R].MinneapolisUniversityofMinnesota,2002.
[4]MARQUESJP,WRITTEN,WUYF,etal.PatternRecognitionConcepts,MethodsandApplications(2nded)[M].Beijing:TsinghuaUniversityPress,2002.
[5]DHILONI.Co-clusteringDocumentsandwordsusingbipartitespec-tralgraphpartitioning[C].SanDiegaProceedingsofthe7thACMSIGKDD,2001.
[6]SAMBASIVAMS,THEODOSOPOULOSN.AdvanceddataclusteringminingWebdocuments[J].IssuesinInformingScienceandInformationTechnology,2006(3).
[7]NANNIM,PEDRESCHID.Time-Focusedclusteringoftrajectoriesofmovingobjects[J].JournalofIntelligentInformationSystems,2006(3).
[8]BIRANTD,KUTA.ST-DBSCAN:ANalgorithmforclusteringspatial-temporaldata[J].Data&KnowledgeEngineering,2007(1).
[9]CRISTOFORD,SINOVICIDA.Aninformation-theoreticalapproachtoclusteringcategoricaldatabasesusinggeneticalgorithms[C].ArlingtonThe2ndSIAMICDM,WorkshoponClusteringHighDinen-sionalData,2001.
篇5
眼淚的成語
1、淚眼汪汪 熱淚盈眶 嚎天動(dòng)地 飲恨吞聲
2、號(hào)G大哭 喜極而泣 淚如泉滴 街號(hào)巷哭
3、鬼哭狼嗥 牛農(nóng)對(duì)泣 痛哭流涕 呼天喚地
4、泣下沾襟 淚如泉涌 涕淚交流 涕淚交零
5、哭天抹淚 催人淚下 嚎天喊地 泣不成聲
6、涕泗交頤 泣涕如雨 觸目慟心 鬼哭神驚
7、號(hào)啕大哭 神愁鬼哭 鬼抓狼嚎 涕淚交加
8、淚如雨下 抱頭大哭 淚流滿面 以淚洗面
9、聲淚俱下 淚迸腸絕 擂天倒地 啼天哭地
10、行號(hào)巷哭 淚下如雨 老淚縱橫 鳥哭猿啼
11、死聲G氣 鬼哭天愁 行號(hào)臥泣 枕戈泣血
12、呼天號(hào)地 潸然淚下 凄然淚下 梨花帶雨
13、淚干腸斷 嗚嗚咽咽 神號(hào)鬼泣 涕淚交垂
14、涕淚交集
眼淚的成語解釋
1、潸然淚下:潸然:流淚的樣子。形容眼淚流下來。
2、感激涕泗:涕:眼淚;泗:鼻涕。感激得掉下眼淚。形容極度感激。
3、眼淚洗面:淚流滿面。形容極端悲痛。
4、愁眉淚眼:皺著眉頭,掉下眼淚。形容愁苦悲傷的樣子。
5、飲血崩心:血:血淚;飲血:形容極度悲憤。血淚滿面,心為之碎。形容極度悲痛。
6、涕零如雨:涕零:流淚。眼淚象雨水一樣往下淌。形容思念的感情極深。
7、凄然淚下:凄然:寒涼。形容凄涼悲傷。
8、血淚斑斑:血與淚俱在實(shí)證物。
9、吞聲忍淚:形容強(qiáng)忍悲傷。
10、吞聲飲淚:吞聲:咽下哭聲;飲淚:忍住淚水。眼淚只能往肚里流,不敢哭出聲來。形容受壓迫時(shí),忍受痛苦,不敢公開表露。
11、一副急淚:指為了對(duì)付應(yīng)急需要而驟然擠出來的一串眼淚。
12、涕淚交下:鼻涕眼淚同時(shí)流下,形容極度哀痛。同“涕淚交零”。
13、鱷魚眼淚:鱷魚:一種生性兇殘,捕食人、畜的爬行動(dòng)物。傳說鱷魚在吞食人畜時(shí),邊吃邊流眼淚。比喻惡人的假慈悲。
14、熱淚盈眶:盈:充滿;眶:眼眶。因感情激動(dòng)而使眼淚充滿了眼眶,形容感動(dòng)至極或非常悲傷。
15、雨泣云愁:淚下如雨,愁多如云。形容憂愁深重。
16、淚迸腸絕:指悲痛得淚涌腸斷。
17、泣數(shù)行下:眼淚接連不斷的往下掉。形容非常悲傷。
18、愴然淚下:愴然:傷感的樣子。傷感地流淚不止。形容非常悲痛。
19、慟哭流涕:慟:哀痛;涕:眼淚。形容極其悲痛傷心。
20、涕淚交零:鼻涕眼淚同時(shí)流下,形容極度哀痛。
21、涕泗流漣:鼻涕眼淚直往下流。形容痛哭流涕。
22、涕泗縱橫:眼淚鼻涕滿臉亂淌。形容極度悲傷。同“涕泗橫流”。
23、淚眼汪汪:汪汪:滿眼淚水的樣子。兩眼充滿淚水。
24、涕淚交加:猶涕淚交零。
25、涕泗交下:眼淚鼻涕一起流下。形容痛哭的樣子。同“涕泗交流”。
26、泣下如雨:眼淚象雨一樣。形容傷心到極點(diǎn)。
27、流涕痛哭:涕:眼淚。形容傷心到極點(diǎn)。
28、奪眶而出:眶:眼眶。眼淚一下子從眼眶中涌出。形容人因極度悲傷或極度歡喜而落淚。
29、涕泗滂沱:滂沱:雨下得很大。雨下得很大的樣子。形容哭得很厲害,眼淚鼻涕象下雨一樣。
30、淚如泉滴:形容觸動(dòng)傷心事,眼淚象泉水一樣流出。
31、潸然淚下:潸然:流淚的樣子。形容淚流不止。
32、濕哭干啼:濕哭:有眼淚地啼哭;干啼:沒有眼淚地啼哭。形容哭哭啼啼的樣子。也泛指因苦楚而呈現(xiàn)出的各種表情。
33、揮涕增河:抹下來的眼淚可以增添河水的分量。比喻行為對(duì)個(gè)人有損而對(duì)國(guó)家也無所補(bǔ)益。
34、哭天抹淚:形容哭哭啼啼。
35、涕淚交垂:鼻涕眼淚同時(shí)流下,形容極度悲哀。
36、淚出痛腸:痛遙:傷痛的內(nèi)心。指因心里難過而流出了眼淚。
37、淚如泉涌:眼淚象泉水一樣直往外涌。形容悲痛或害怕之極。
38、干啼濕哭:干啼:沒有眼淚地啼哭;濕哭:有眼淚地啼哭。形容哭哭啼啼的樣子。也泛指因苦楚而呈現(xiàn)出的各種表情。
39、淚干腸斷:形容傷心到極點(diǎn)。
40、泣涕如雨:泣:低聲哭;涕:鼻涕。眼淚像雨一樣。形容極度悲傷。
41、吞聲忍泣:吞聲:咽下哭聲;忍泣:忍住淚水。眼淚只能往肚里流,不敢哭出聲來。形容受壓迫時(shí),忍受痛苦,不敢公開表露。
42、涕泗橫流:眼淚鼻涕滿臉亂淌。形容極度悲傷。
43、愴然涕下:愴然:傷感的樣子;涕:眼淚。傷感地流淚不止。形容非常悲痛。
44、涕淚交流:鼻涕眼淚同時(shí)流下,形容極度哀痛。同“涕淚交零”。
45、奪眶而出:奪:用力沖開;眶:眼的四周。指眼淚無法控制地從眼里流出,形容心情非常激動(dòng)。
46、垂涕而道:涕:眼淚,鼻涕;道:講。流著眼淚說話。形容十分沉痛地懇切陳詞。
47、悲愁垂涕:垂:垂下。涕:淚。因?yàn)楸А⒊羁喽錅I。
48、催人淚下:催:催促,促使。形容事跡十分感人,使人不禁流下眼淚。
49、破涕為歡:涕:眼淚。一下子停止了哭泣,露出笑容。形容轉(zhuǎn)悲為喜。
50、愁眉淚眼:愁眉:緊皺眉頭。皺著眉頭,掉下眼淚。形容愁苦悲傷的樣子。
51、催人淚下:催:催促,促使。形容事跡等十分感人,使人不禁流下眼淚。
52、涕泗交頤:眼淚鼻涕流滿臉頰。形容哀慟哭泣。
53、斷線珍珠:比喻眼淚像斷了線的珍珠一般紛紛落下。
54、吞聲飲泣:吞聲:咽下哭聲;飲泣:忍住淚水。眼淚只能往肚里流,不敢哭出聲來。形容受壓迫時(shí),忍受痛苦,不敢公開表露。
55、忍淚含悲:忍著眼淚,含著悲痛。形容勉強(qiáng)克制著悲傷。
56、感極涕零:感激之極而流下眼淚。形容極為感激。
57、涕泗交流:眼淚鼻涕一起流下。形容痛哭的樣子。
58、垂涕而道:涕:鼻涕,眼淚。流著眼淚說話。比喻十分沉痛地懇切陳詞。
59、感激流涕:涕:眼淚。感激得掉下眼淚。形容極度感激。
60、柔腸粉淚:指女子柔弱的心腸和含情的眼淚。形容女性的纏綿情意。
61、一字一淚:一個(gè)字就仿佛是一滴眼淚。形容文字寫得凄楚感人。亦作“一言一淚”。
62、飲泣吞聲:泣:無聲的哭;吞聲:不敢出聲。眼淚只能往肚里流,不敢哭出聲來。形容忍受痛苦,不敢公開表露。
63、肚里淚下:眼淚往肚里流。形容有苦說不出。
64、淚下如雨:淚水如同雨水一樣流下來,形容十分悲傷。
65、噫嗚流涕:噫嗚:哭聲。噫噫嗚嗚哭著流淚。
66、淚河?xùn)|注:眼淚似向東的的河流一樣。比喻人極度悲痛。
67、愁眉淚眼:皺著眉頭,含著眼淚。形容悲苦的樣子。
68、抹淚揉眵:眵:眼屎,此指眼睛。擦著眼淚,揉著眼睛。形容落淚傷心的樣子。
69、淚下如雨:眼淚象雨水似的直往下流。形容悲痛或害怕之極。
70、以淚洗面:拿眼淚來洗臉。形容極度憂傷悲痛,終日流淚。
71、拋珠滾玉:拋:拋擲。形容眼淚如同珠玉般滾落。
72、揉眵抹淚:眵:眼屎,此指眼睛。擦著眼淚,揉著眼睛。形容落淚傷心的樣子。
73、涕淚交集:眼淚和鼻涕一起流著。形容悲痛到了極點(diǎn)。亦作“涕淚交加”。
74、聲淚俱下:一邊說一邊哭。形容極其悲慟。
75、淚如雨下:眼淚象雨水似的直往下流。形容悲痛或害怕之極。
76、眼淚汪汪:眼中飽含淚水。形容人十分激動(dòng)或悲痛。
77、飲泣吞聲:飲泣:忍住淚水;吞聲:咽下哭聲。眼淚只能往肚里流,不敢哭出聲來。形容受壓迫時(shí),忍受痛苦,不敢公開表露。
78、血淚盈襟:血淚:悲痛的眼淚;盈:滿。眼淚流濕了衣襟。形容非常悲痛。
79、破涕為笑:涕:眼淚。一下子停止了哭泣,露出笑容。形容轉(zhuǎn)悲為喜。
80、痛哭流涕:涕:眼淚。形容傷心到極點(diǎn)。
篇6
【關(guān)鍵詞】拉米夫定;替比夫定;恩替卡韋;HBeAg定量;療效
【中圖分類號(hào)】R512 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1004-7484(2014)02-0704-02
抗病毒治療是慢性乙型肝炎(chronic hepatitis B,CHB)治療的關(guān)鍵,應(yīng)用核苷類似物抗病毒治療,有作用快,不良反應(yīng)少,服用方便的優(yōu)點(diǎn),目前應(yīng)用核苷類似物治療慢性乙型肝炎的患者為數(shù)眾多。但核苷類似物普遍存在只能抑制病毒復(fù)制,未達(dá)到血清學(xué)轉(zhuǎn)換不能停藥,長(zhǎng)期使用還有出現(xiàn)病毒變異和耐藥的風(fēng)險(xiǎn),因此尋找恰當(dāng)?shù)呐R床監(jiān)測(cè)指標(biāo)預(yù)測(cè)療效,[1-2]并根據(jù)患者應(yīng)答反應(yīng)及時(shí)調(diào)整治療方案是目前慢性乙型肝炎患者抗病毒治療的熱點(diǎn)和難點(diǎn)問題。我們選擇我院66例服用核苷類似物治療的HBeAg陽(yáng)性的慢性乙型肝炎患者,觀察治療過程中HBeAg、HBVDNA定量的變化,發(fā)現(xiàn)可以根據(jù)HBeAg的變化來預(yù)測(cè)核苷類似物的療效。現(xiàn)將有關(guān)內(nèi)容報(bào)告如下:
1 材料與方法
病例來源2010年1月至2012年12月門診及住院的66例HBeAg陽(yáng)性慢性乙型肝炎患者,男45例,女21例,年齡18-36歲,中位年齡為25歲,診斷符合2010年修訂的《慢性乙型肝炎防治指南(2010年版)》診斷標(biāo)準(zhǔn)(3),排除甲型肝炎(HAV)、丙型肝炎(HCV)、戊型肝炎(HEV)、人類免疫缺陷病毒(HIV)等其他病毒感染,既往未應(yīng)用抗病毒治療及免疫調(diào)節(jié)劑。66例患者分為三組,應(yīng)用拉米夫定治療的36人,替比夫定18人,恩替卡韋治療的12人,三組患者的性別、年齡差異無統(tǒng)計(jì)學(xué)意義。
治療方法 拉米夫定 (賀普丁,葛蘭素史克制藥(蘇州)有限公司) 100 mg,每日1次口服,替比夫定(素比伏,北京諾華制藥有限公司)600 mg,每日1次口服,恩替卡韋(博路定,中美上海施貴寶制藥有限公司 )0.5 mg,每日1次口服, 根據(jù)患者肝功能情況適當(dāng)應(yīng)用保肝藥物,ALT > 5倍正常值應(yīng)用甘草酸二銨注射液250 ml靜脈滴注每日1次,肝功能好轉(zhuǎn)改為甘草酸二銨腸溶膠囊口服100毫克每日3次,肝功正常再減量為100毫克日2次鞏固2周停服保肝藥物;ALT < 5倍正常值應(yīng)用甘草酸二銨腸溶膠囊口服150毫克,每日3次,肝功能好轉(zhuǎn)后減量為100毫克,每日3次,肝功正常再減量為100毫克,每日2次,鞏固2周停保肝藥物。抗病毒治療時(shí)間觀察至2年。
檢測(cè)方法 使用促凝管抽取5 ml靜脈血,立即分離血清,置于2~8 ℃ 保存。HBV DNA定量采用聚合酶鏈反應(yīng)(PCR-熒光探針法)(深圳市匹基生物工程有限公司生產(chǎn)的乙型肝炎病毒核酸擴(kuò)增熒光定量檢測(cè)試劑盒),檢測(cè)下限為500拷貝/ml。HBeAg定量采用化學(xué)發(fā)光法(LiCA)(博陽(yáng)生物科技有限公司生產(chǎn)的儀器及配套試劑),HBeAg檢測(cè)范圍為0~65 PEIU/ml。
觀察指標(biāo) 觀察三組治療前、治療24周、52周、72周、104周的HBeAg、 HBVDNA定量,分析早期HBeAg定量的變化與耐藥發(fā)生的相關(guān)性,預(yù)測(cè)遠(yuǎn)期療效。
療效評(píng)價(jià) 72周時(shí),HBV DNA低于檢測(cè)下限并HBeAg消失或血清學(xué)轉(zhuǎn)換為有效,否則為無效,72周內(nèi)再次出現(xiàn)HBV DNA高于檢測(cè)下限為病毒學(xué)突破
統(tǒng)計(jì)學(xué)方法 應(yīng)用SPSS 13.0軟件分析,計(jì)量資料以 ± s表示,組間采用t檢驗(yàn)進(jìn)行比較,P < 0.05為差異有統(tǒng)計(jì)學(xué)意義。
結(jié)果:拉米夫定組、恩替卡韋組未見明顯不良反應(yīng),替比夫定組有4例出現(xiàn)肌酸激酶增高,其中一例CK最高達(dá)1025u/L,均無明顯肌肉酸痛,囑其減少運(yùn)動(dòng)量并密切觀察,未予停藥, 2周后化驗(yàn)CK下降,之后定期檢測(cè)CK未再出現(xiàn)明顯增高情況。66例患者中有效25例,無效41例,24周內(nèi)所有患者HBV DNA轉(zhuǎn)陰,未發(fā)現(xiàn)有原發(fā)耐藥病例,隨訪至104周,后期HBeAg變化不顯著,病毒耐藥病例未有增多。
篇7
關(guān)鍵字:數(shù)據(jù)挖掘;Web數(shù)據(jù)挖掘;聚類分析;聚類算法
一、引言
隨著計(jì)算機(jī)技術(shù)、數(shù)據(jù)庫(kù)技術(shù)、網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,各種信息知識(shí)可以在網(wǎng)絡(luò)上獲得。網(wǎng)絡(luò)在給人們帶來便利的同時(shí)也帶來了不少弊端,造成了知識(shí)的"污染",面臨信息的海洋,呼喚一種從數(shù)據(jù)海洋中去粗取精、去偽存真的技術(shù)來準(zhǔn)確、快速地獲取有用的、隱含的信息,在這種形勢(shì)下,Web數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。
近年來,時(shí)空數(shù)據(jù)挖掘已受到國(guó)際學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,時(shí)空信息的認(rèn)知和數(shù)據(jù)模型的研究進(jìn)展是時(shí)空數(shù)據(jù)挖掘研究的基礎(chǔ),時(shí)空數(shù)據(jù)挖掘的理論研究主要受到空間數(shù)據(jù)挖掘和時(shí)態(tài)數(shù)據(jù)挖掘研究的影響,并以經(jīng)典的數(shù)據(jù)挖掘理論為基礎(chǔ),挖掘時(shí)空知識(shí)或規(guī)則。
時(shí)空聚類分析作為時(shí)空數(shù)據(jù)挖掘的一個(gè)主要研究?jī)?nèi)容,是計(jì)算機(jī)科學(xué)與地球信息科學(xué)領(lǐng)域交叉研究中的一個(gè)最前沿、最具挑戰(zhàn)的研究課題。時(shí)空聚類分析旨在從時(shí)空數(shù)據(jù)庫(kù)中發(fā)現(xiàn)具有相似特征的時(shí)空實(shí)體結(jié)合(即時(shí)空簇),亦是傳統(tǒng)的聚類分析從空間域到時(shí)空域的進(jìn)一步擴(kuò)展。時(shí)空聚類在全球氣候變化、公共衛(wèi)生安全、地震檢測(cè)分析以及犯罪熱點(diǎn)分析等領(lǐng)域具有重要應(yīng)用價(jià)值,有助于更好地發(fā)現(xiàn)和分析地理現(xiàn)象發(fā)展變化的趨勢(shì)、規(guī)律與本質(zhì)特征。
本文把時(shí)空聚類分析應(yīng)用在Web數(shù)據(jù)挖掘中,具有很強(qiáng)的現(xiàn)實(shí)意義與理論價(jià)值。一方面,通過聚類挖掘可以找空間實(shí)體即水性漆生產(chǎn)商的地理分布規(guī)律,幫助決策者更快地找到所需的信息;另一方面,對(duì)行業(yè)數(shù)據(jù)重新組織,讓相鄰、相近的數(shù)據(jù)盡量編排在一塊,可以提高訪問速度,對(duì)于預(yù)測(cè)整個(gè)水性漆行業(yè)的發(fā)展動(dòng)態(tài)有積極的意義。
二、國(guó)內(nèi)外研究現(xiàn)狀及分析
國(guó)內(nèi)外學(xué)者已經(jīng)針對(duì)時(shí)空聚類分析開展了初步的研究,現(xiàn)有的時(shí)空聚類方法主要包括時(shí)空掃描統(tǒng)計(jì)方法、基于密度的方法以及基于時(shí)空距離的方法。最近, Kisilevich[1] 等對(duì)時(shí)空聚類分析方法進(jìn)行了較為系統(tǒng)的闡述。時(shí)空聚類分析研究雖然已經(jīng)取得一定成果,但依然面臨兩方面難點(diǎn): (1) 時(shí)空數(shù)據(jù)具有時(shí)空耦合的特點(diǎn)。 時(shí)空數(shù)據(jù)是空間維與時(shí)間維的有機(jī)組合, 空間數(shù)據(jù)與時(shí)序數(shù)據(jù)的一些性質(zhì)并不能直接推廣到時(shí)空域。 例如, 空間數(shù)據(jù)不存在過去、現(xiàn)在、將來的區(qū)別, 而時(shí)空數(shù)據(jù)卻具有這種特性;(2) 時(shí)空數(shù)據(jù)具有時(shí)空相關(guān)性與時(shí)空異質(zhì)性兩個(gè)重要性質(zhì)。 時(shí)空數(shù)據(jù)的分布在時(shí)間和空間上具有關(guān)聯(lián)性, 也會(huì)隨著時(shí)間和空間的變化而產(chǎn)生差異。 此外, 當(dāng)前的時(shí)空聚類分析研究仍沒有形成一套具有普適性的理論方法框架。
現(xiàn)有的時(shí)空聚類方法主要包括時(shí)空掃描統(tǒng)計(jì)方法、基于密度的方法以及基于時(shí)空距離的方法。 最近, Kisilevich 等對(duì)時(shí)空聚類分析方法進(jìn)行了較為系統(tǒng)的闡述,其主要思想是采用一個(gè)預(yù)設(shè)的時(shí)空掃描窗口, 即由空間距離定義半徑、時(shí)間間隔定義高度的圓柱體, 以每個(gè)時(shí)空實(shí)體為中心進(jìn)行掃描, 借助統(tǒng)計(jì)檢驗(yàn)的方法確定疾病爆發(fā)的聚集區(qū)域。 該方法一方面需要預(yù)先假定數(shù)據(jù)的概率分布模型, 且結(jié)果受掃描窗口的影響較大, 另一方面不能詳細(xì)描述時(shí)空簇的位置和形狀信息。最近, Pei 等發(fā)展了一種基于窗口鄰近的時(shí)空聚類方法, 其主要思想是定義一個(gè)圓柱形的時(shí)空鄰近域, 在每個(gè)時(shí)空鄰域內(nèi)區(qū)分聚集部分和噪聲部分, 并采用 DBSCAN 密度相連的策略將聚集部分連接成時(shí)空簇。 該方法只能針對(duì)僅存在兩種 Poisson 分布(簇與噪聲) 的時(shí)空數(shù)據(jù)進(jìn)行時(shí)空聚類操作, 且無法顧及時(shí)空實(shí)體的非空間屬性。 基于時(shí)空距離的方法可以區(qū)分為兩類, 一類是從時(shí)間、空間兩個(gè)角度分別定義時(shí)空鄰近實(shí)體; 另一類是綜合定義時(shí)空耦合距離, 這類方法主要用于地震序列的時(shí)空聚集性發(fā)現(xiàn), 在實(shí)際中時(shí)空屬性的融合比較困難。
綜上分析, 可以發(fā)現(xiàn)目前尚缺乏一種能夠同時(shí)顧及時(shí)空實(shí)體的非空間屬性和時(shí)空實(shí)體時(shí)空耦合特性的時(shí)空聚類方法。 為此, 下面將發(fā)展一種時(shí)空聚類分析的新策略。
三、時(shí)空聚類分析在Web數(shù)據(jù)挖掘中的研究與應(yīng)用
1.研究目標(biāo):本課題通過在研究空間數(shù)據(jù)挖掘、XML 數(shù)據(jù)挖掘、時(shí)空數(shù)據(jù)挖掘基礎(chǔ)上,對(duì)時(shí)空聚類的關(guān)鍵技術(shù)進(jìn)行分析,設(shè)計(jì)出適合Web數(shù)據(jù)挖掘的時(shí)空聚類挖掘的算法并構(gòu)建原型系統(tǒng),實(shí)現(xiàn)對(duì)行業(yè)網(wǎng)站數(shù)據(jù)時(shí)空聚類挖掘。
2.研究?jī)?nèi)容:(1) 數(shù)據(jù)的聚集趨勢(shì)估計(jì),即判斷數(shù)據(jù)能否進(jìn)行聚類分析; (2) 聚類方法設(shè)計(jì); (3) 聚類結(jié)果有效性評(píng)價(jià)。在地理空間中,時(shí)間和空間上的相關(guān)性是時(shí)空實(shí)體的基本特征,也是進(jìn)行時(shí)空聚類分析的前提。若實(shí)體間沒有相關(guān)性,則不會(huì)產(chǎn)生明顯的聚集現(xiàn)象。時(shí)空聚類旨在將時(shí)空相關(guān)性較強(qiáng)的時(shí)空實(shí)體聚在同一簇,時(shí)空聚類過程中必須充分考慮實(shí)體間的相關(guān)性。因此,時(shí)空聚類分析可以歸納為 3 個(gè)步驟。
首先,需要對(duì)時(shí)空數(shù)據(jù)進(jìn)行探索性分析,掌握時(shí)空數(shù)據(jù)的特性。其主要包括: (1) 時(shí)空相關(guān)性分析,判斷時(shí)空數(shù)據(jù)是否可以進(jìn)行時(shí)空聚類分析;(2) 時(shí)空平穩(wěn)性分析,分析時(shí)空數(shù)據(jù)的時(shí)空異質(zhì)特征。
其次,根據(jù)時(shí)空數(shù)據(jù)的具體特點(diǎn)發(fā)展專門性的時(shí)空聚類方法。
最后,需要對(duì)時(shí)空聚類分析的結(jié)果進(jìn)行分析和評(píng)價(jià)。
擬解決的關(guān)鍵問題:從時(shí)空數(shù)據(jù)的基本特征出發(fā),建立一套時(shí)空聚類分析的理論方法框架,并提出一種時(shí)空一體化的時(shí)空聚類方法,應(yīng)用于中國(guó)水性漆網(wǎng)的Web數(shù)據(jù)庫(kù),確認(rèn)其有效性。
3.項(xiàng)目研究方案:
第一步:時(shí)空聚類分析:包括時(shí)空數(shù)據(jù)探索性分析、時(shí)空鄰近域構(gòu)建和時(shí)空聚類方法。
第二步:中國(guó)水性漆網(wǎng)站數(shù)據(jù)時(shí)空聚類分析,包括數(shù)據(jù)描述與預(yù)處理:選取中國(guó)水性漆網(wǎng)站數(shù)據(jù)庫(kù)進(jìn)行實(shí)例分析;時(shí)空數(shù)據(jù)探索性分析:首先對(duì)數(shù)據(jù)的空間相關(guān)性進(jìn)行檢驗(yàn),這里借助變差函數(shù)來分析空間相關(guān)性。進(jìn)而,采用普通 Kriging方法進(jìn)行插值;一種基于 LINQ 查詢與 K-Means 結(jié)合的時(shí)空聚類算法:在分析、比較經(jīng)典聚類算法的基礎(chǔ)上,結(jié)合水性漆網(wǎng)站時(shí)空數(shù)據(jù)的特點(diǎn),提出了一種將擴(kuò)展的 XML 文檔查詢語言LINQ與經(jīng)典的K-Means聚類算法相結(jié)合的算法,通過實(shí)驗(yàn)驗(yàn)證該算法的有效性及優(yōu)越性。
時(shí)空聚類原型體系結(jié)構(gòu)及設(shè)計(jì)實(shí)現(xiàn):為驗(yàn)證算法的實(shí)用性,基于 ArcEngine采用 C#語言開發(fā)了水性漆網(wǎng)站數(shù)據(jù)時(shí)空聚類原型系統(tǒng)。
四、結(jié)束語
本文提出了時(shí)空聚類分析的理論方法框架, 該框架易于推廣用于其他類型的時(shí)空數(shù)據(jù), 具有很強(qiáng)的普適性;很好地顧及了時(shí)空數(shù)據(jù)的時(shí)空耦合、時(shí)空相關(guān)與時(shí)空異質(zhì)特征, 避免了過多人為主觀因素的干擾, 時(shí)空聚類結(jié)果具有較好的可靠性。
參考文獻(xiàn):
[1] 陸玉昌。數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)[M]。成都:西南交通大學(xué)出版社,2005
[2] 金艷云。Web數(shù)據(jù)挖掘綜述[J]。現(xiàn)代計(jì)算機(jī),2012(11)
[3] 莊怡雯。基于聚類算法的Web日志挖掘應(yīng)用研究[D]。東華大學(xué),2010
[4] 劉小利,劉小輝。數(shù)據(jù)聚類算法在Web數(shù)據(jù)挖掘中的應(yīng)用[J]。科技創(chuàng)新導(dǎo)報(bào),2012(31)
篇8
【關(guān)鍵詞】 類風(fēng)濕關(guān)節(jié)炎;證候;BP神經(jīng)網(wǎng)絡(luò);非線性建模
證候是一個(gè)非線性復(fù)雜系統(tǒng),中醫(yī)證候的診斷過程,實(shí)質(zhì)上是由臨床收集到的各種癥狀,通過分析歸納,獲得證型診斷的過程,這個(gè)過程,可以看作是一個(gè)從觀察指標(biāo)到證型診斷的非線性映射過程,用非線性數(shù)學(xué)模型可以充分模擬。基于黑箱結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)具有強(qiáng)大的非線性擬合能力,能夠任意精度逼近非線性函數(shù),因此,我們將其用于類風(fēng)濕關(guān)節(jié)炎(rehumatoid arthritis,RA)證候的非線性建模研究。
1 臨床資料
本研究采用中國(guó)中醫(yī)科學(xué)院望京醫(yī)院提供的765例RA臨床證候資料。參考《中藥新藥臨床研究指導(dǎo)原則(試行)》[1]、文獻(xiàn)整理結(jié)果及專家經(jīng)驗(yàn),制定臨床觀察表。共觀察183個(gè)癥狀、體征,每個(gè)癥狀按無、輕、中、重分別記為0、1、2、3分;并同時(shí)給出肝腎不足證、寒濕阻絡(luò)證、瘀血阻絡(luò)證、氣血兩虛證、痰瘀阻絡(luò)證、陰虛內(nèi)熱證、熱毒蘊(yùn)結(jié)證、寒熱錯(cuò)雜證、脾腎陽(yáng)虛證等10個(gè)基本證型的診斷。從上述病例中抽取臨床癥狀和證型診斷構(gòu)成樣本集合,作為神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和測(cè)試樣本。在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,癥狀向量作為神經(jīng)網(wǎng)絡(luò)的輸入向量,證型診斷分別對(duì)應(yīng)網(wǎng)絡(luò)的輸出向量。
2 研究方法
2.1 數(shù)據(jù)預(yù)處理及病例分組
先對(duì)所有數(shù)據(jù)進(jìn)行歸一化處理,使處理后的輸入輸出信息均在(0,1)區(qū)間。對(duì)上述數(shù)據(jù)進(jìn)行主成分分析,主成分的選擇標(biāo)準(zhǔn)定為95%。數(shù)據(jù)經(jīng)過主成分分析,前98個(gè)主成分的貢獻(xiàn)率涵蓋了總共183個(gè)指標(biāo)的95.035%的信息,故我們?nèi)∏?8個(gè)主成分作為進(jìn)一步分析的指標(biāo)。通過主成分分析,輸入向量從183個(gè)減至98個(gè)。可見原始數(shù)據(jù)有很大的冗余。
將765例樣本隨機(jī)分為A、B、C 3組,每組255例。依次選取其中兩組作為訓(xùn)練集,另一組作為測(cè)試集,共循環(huán)3次。
2.2 建立基于共軛梯度下降算法的類風(fēng)濕關(guān)節(jié)炎證候BP網(wǎng)絡(luò)模型
2.2.1 類風(fēng)濕關(guān)節(jié)炎證候BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
在MATLAB7.0環(huán)境下,建立基于共軛梯度下降算法的三層前向BP神經(jīng)網(wǎng)絡(luò)模型。該模型包括輸入層、隱層和輸出層,其中輸入層包含183個(gè)輸入神經(jīng)元;隱層有2個(gè),各包含100個(gè)神經(jīng)元;輸出層包含10個(gè)輸出神經(jīng)元。兩個(gè)隱層之間通過正切S型傳遞函數(shù)(tansig)連接,隱層與輸出層之間用對(duì)數(shù)S型傳遞函數(shù)(logsig)連接。設(shè)定該網(wǎng)絡(luò)的系統(tǒng)誤差小于0.01,最大迭代次數(shù)500次。
2.2.2 類風(fēng)濕關(guān)節(jié)炎證候BP網(wǎng)絡(luò)的輸出方式
將具有肝腎不足證、寒濕阻絡(luò)證、瘀血阻絡(luò)證、氣血兩虛證、痰瘀阻絡(luò)證、陰虛內(nèi)熱證、熱毒蘊(yùn)結(jié)證、寒熱錯(cuò)雜證、脾腎陽(yáng)虛證等10種證型診斷樣本的期望輸出值分別定為(0,1,0,0,0,0,0,0, 0,0),……,(0,0,0,0,0,0,0,0,0,1)。預(yù)測(cè)整合輸出值為(0, 0.2,0.4,0.6,0.8,1),這6個(gè)數(shù)值分別對(duì)應(yīng)原始輸出值的(0-0.1,0.1-0.3,0.3-0.5,0.5-0.7,0.7-0.9,0.9-1)區(qū)間的數(shù)值。整合輸出值≤0.4為診斷不成立,≥0.6為診斷成立。
2.2.3 基于共軛梯度下降算法的類風(fēng)濕關(guān)節(jié)炎證候BP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練
網(wǎng)絡(luò)參數(shù)的初始值取為[-0.5,+0.5]上均勻分布的隨機(jī)數(shù),利用train函數(shù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,第1次訓(xùn)練經(jīng)過89次迭代以后,網(wǎng)絡(luò)的系統(tǒng)誤差降至0.009 450 59;第2次訓(xùn)練經(jīng)過56次迭代后,網(wǎng)絡(luò)的系統(tǒng)誤差降至0.009 423 47;第3次訓(xùn)練經(jīng)過58次迭代以后,網(wǎng)絡(luò)的系統(tǒng)誤差降至0.009 174 36。上述數(shù)值均小于規(guī)定的最小誤差0.01,提示網(wǎng)絡(luò)趨于穩(wěn)定,網(wǎng)絡(luò)性能達(dá)標(biāo),訓(xùn)練自動(dòng)停止。
2.2.4 類風(fēng)濕關(guān)節(jié)炎證候BP神經(jīng)網(wǎng)絡(luò)模型的測(cè)試
該網(wǎng)絡(luò)模型的權(quán)值趨穩(wěn),訓(xùn)練結(jié)束后,分3次分別對(duì)1/3測(cè)試樣本做檢驗(yàn)。規(guī)定單證陽(yáng)性診斷的符合情況為單證特異性;所有單證診斷的符合情況為單證準(zhǔn)確率;病例的全部證型診斷符合情況為診斷準(zhǔn)確率。即:?jiǎn)巫C特異性(%)=預(yù)測(cè)輸出所有單證陽(yáng)性符合例數(shù)/期望輸出所有單證陽(yáng)性例數(shù)×100%;單證準(zhǔn)確率(%)=預(yù)測(cè)輸出所有單證符合例數(shù)/期望輸出所有單證例數(shù)×100%;診斷準(zhǔn)確率(%)=預(yù)測(cè)輸出符合例數(shù)/所有病例數(shù)×100%。其中,以整合輸出值的大小排序,主證為證候的前2位證類,兼證為第3位證類,第3位以后的證類忽略不計(jì)。
3 結(jié)果
測(cè)試結(jié)果顯示:3次測(cè)試的平均單證特異性為81.31%,平均單證準(zhǔn)確率為95.70%,平均診斷準(zhǔn)確率為90.72%。結(jié)果見表1。表1 RA證候BP神經(jīng)網(wǎng)絡(luò)模型測(cè)試結(jié)果與臨床診斷結(jié)果的比較(略)
4 討論
ANN的一個(gè)顯著特征是它能夠通過自動(dòng)學(xué)習(xí)來解決問題,對(duì)樣本的學(xué)習(xí)過程,即為對(duì)網(wǎng)絡(luò)中神經(jīng)元間的聯(lián)系強(qiáng)度(即權(quán)重系數(shù))逐步確定的過程,通過對(duì)樣本的學(xué)習(xí),可以學(xué)會(huì)識(shí)別自變量與應(yīng)變量間的復(fù)雜的非線性關(guān)系。經(jīng)過充分學(xué)習(xí)后的ANN獲取了樣本的特征規(guī)則,并將這些規(guī)則以數(shù)字的形式分布存貯在網(wǎng)絡(luò)的連接權(quán)中,從而構(gòu)成了系統(tǒng)的非線性映射模型。用ANN建模,可將過程或?qū)ο罂闯梢粋€(gè)“黑箱”,只要測(cè)得輸入輸出數(shù)據(jù),就可以建立相應(yīng)的模型,不必象傳統(tǒng)的系統(tǒng)辨識(shí)那樣把過程或?qū)ο蠓譃榫€性系統(tǒng)還是非線性系統(tǒng),也不必對(duì)過程或?qū)ο髢?nèi)部進(jìn)行分析,這對(duì)未知過程的系統(tǒng)辨識(shí)是十分方便的。
中醫(yī)證候體系具有復(fù)雜系統(tǒng)的非線性、開放性、層次性、涌現(xiàn)性和高維性特征,是一個(gè)多維多階多變量的非線性復(fù)雜系統(tǒng)[2-3]。中醫(yī)學(xué)辨證施治過程,實(shí)質(zhì)上是對(duì)大量數(shù)據(jù)信息作出處理,提取規(guī)律的過程。如何從中醫(yī)學(xué)大量現(xiàn)象學(xué)描述中尋找其內(nèi)在規(guī)律,是證的規(guī)范化研究之熱點(diǎn)和難點(diǎn)。以往多采用統(tǒng)計(jì)學(xué)方法,但效果不夠理想。ANN作為一種智能信息處理系統(tǒng),能夠充分逼近任意復(fù)雜的非線性關(guān)系,獲得樣本數(shù)據(jù)的規(guī)則,較好避免數(shù)據(jù)處理中可能摻雜的主觀因素,客觀如實(shí)地反映研究對(duì)象[4],因此,可以將其用于中醫(yī)證候的非線性建模研究。
我們?cè)贛ATLAB7.0環(huán)境下,對(duì)一組RA臨床證候資料建立了基于共軛梯度算法的BP神經(jīng)網(wǎng)絡(luò)證候模型,并用3倍交叉驗(yàn)證的方法進(jìn)行測(cè)試,結(jié)果顯示:該模型具有很好的診斷、預(yù)測(cè)能力。說明ANN能夠充分模擬癥狀與證型診斷之間的非線性映射關(guān)系。這是目前在不打開人體黑箱的前提下,建立非線性證候模型、反映證候的內(nèi)在規(guī)律和特征的有效方法。
BP神經(jīng)網(wǎng)絡(luò)有一個(gè)明顯的缺點(diǎn)是收斂速度非常慢,為此,我們基于共軛梯度學(xué)習(xí)算法,采用trainscg函數(shù)改進(jìn)train函數(shù),從而加快了神經(jīng)網(wǎng)絡(luò)的收斂速度。我們建立的RA證候網(wǎng)絡(luò)模型3次訓(xùn)練的迭代次數(shù)分別為89、56、58,說明通過改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)具有很好的收斂性能。
另外,針對(duì)臨床證候資料多存在兼夾證以及各證型之間有主次之分的情況,我們首先將模型的輸出采用1個(gè)輸出節(jié)點(diǎn)對(duì)應(yīng)1種證型的方式,比如,RA證候模型共有10個(gè)證型,我們將包含10個(gè)證型的輸出采用(0,1,0,0,1,0,0,0,0,0)的方式,其中,括號(hào)內(nèi)每一個(gè)數(shù)值代表一種證型,“0”表示診斷不成立,“1”表示診斷成立,這樣就可以診斷兼夾證了;然后,我們將整合輸出值整理成(0,0.2,0.4,0.6,0.8,1)等6個(gè)等級(jí)的方式,這6個(gè)數(shù)值分別對(duì)應(yīng)原始輸出值的(0-0.1,0.1-0.3,0.3-0.5, 0.5-0.7,0.7-0.9,0.9-1)區(qū)間的數(shù)值,并規(guī)定整合輸出值≤0.4為診斷不成立,≥0.6為診斷成立,這樣就進(jìn)一步根據(jù)整合輸出值的大小直接判斷有幾個(gè)兼夾證以及各證型的主次地位了。可見,我們建立的RA證候網(wǎng)絡(luò)模型不僅能夠利用神經(jīng)網(wǎng)絡(luò)的自主學(xué)習(xí)能力從大量的樣本中抽提出比較全面的證候內(nèi)在規(guī)律,具有良好的診斷、預(yù)測(cè)能力,而且操作簡(jiǎn)便,真正實(shí)現(xiàn)了證候診斷的智能化。ANN技術(shù)是中醫(yī)證候非線性建模的可行性方法。
雖然我們已經(jīng)證實(shí)了ANN用于證候非線性建模的可行性,但是,以目前的技術(shù),還無法從網(wǎng)絡(luò)的聯(lián)接權(quán)中抽提出網(wǎng)絡(luò)通過自動(dòng)學(xué)習(xí)所獲得的證候規(guī)律,今后可以圍繞這個(gè)關(guān)鍵問題繼續(xù)開展研究。另外,證候的診斷信息具有模糊性特征,用模糊神經(jīng)網(wǎng)絡(luò)理論應(yīng)更能夠逼近證候的全貌,我們?cè)?jīng)試圖用模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行證候的非線性建模研究,但是,目前的模糊神經(jīng)網(wǎng)絡(luò)還無法處理證候的兼夾問題,模糊神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果只能是多類中的一類,因此,我們暫時(shí)未作。今后我們將圍繞這方面展開深入研究,力爭(zhēng)建立證候的模糊神經(jīng)網(wǎng)絡(luò)模型。
總之,一門學(xué)科只有不斷地吸納先進(jìn)的思想與技術(shù),在繼承的基礎(chǔ)上發(fā)展創(chuàng)新,才能真正具有生命力。中醫(yī)證候復(fù)雜系統(tǒng)研究,呼喚非線性科學(xué)、人工神經(jīng)網(wǎng)絡(luò)、計(jì)算數(shù)學(xué)、模糊數(shù)學(xué)、信息工程、醫(yī)學(xué)工程、復(fù)雜性科學(xué)等多種邊緣學(xué)科、交叉學(xué)科理論和技術(shù)方法的介入,理論上的探討和不斷切實(shí)可行的實(shí)踐探索并行,才能使中醫(yī)證候規(guī)范研究從量的積累上升到質(zhì)的飛躍。
參考文獻(xiàn)
[1] .中藥新藥臨床研究指導(dǎo)原則(試行)[S].北京:中國(guó)醫(yī)藥科技出版社,2002.115-119.
[2] 白云靜,申洪波,孟慶剛,等.基于復(fù)雜性科學(xué)的中醫(yī)學(xué)發(fā)展取向與方略[J].中國(guó)中醫(yī)藥信息雜志,2005,12(1):2-5.
[3] 白云靜,申洪波,孟慶剛,等.中醫(yī)證候復(fù)雜性特征及證候研究思路探析[J].中國(guó)中醫(yī)藥信息雜志,2004,11(9):754-756.
[4] 白云靜,申洪波,孟慶剛,等.中醫(yī)證候研究的人工神經(jīng)網(wǎng)絡(luò)方法探析[J].中醫(yī)藥學(xué)刊,2004,22(12):2221-2223.
3 結(jié)果
測(cè)試結(jié)果顯示:3次測(cè)試的平均單證特異性為81.31%,平均單證準(zhǔn)確率為95.70%,平均診斷準(zhǔn)確率為90.72%。結(jié)果見表1。表1 RA證候BP神經(jīng)網(wǎng)絡(luò)模型測(cè)試結(jié)果與臨床診斷結(jié)果的比較(略)
4 討論
ANN的一個(gè)顯著特征是它能夠通過自動(dòng)學(xué)習(xí)來解決問題,對(duì)樣本的學(xué)習(xí)過程,即為對(duì)網(wǎng)絡(luò)中神經(jīng)元間的聯(lián)系強(qiáng)度(即權(quán)重系數(shù))逐步確定的過程,通過對(duì)樣本的學(xué)習(xí),可以學(xué)會(huì)識(shí)別自變量與應(yīng)變量間的復(fù)雜的非線性關(guān)系。經(jīng)過充分學(xué)習(xí)后的ANN獲取了樣本的特征規(guī)則,并將這些規(guī)則以數(shù)字的形式分布存貯在網(wǎng)絡(luò)的連接權(quán)中,從而構(gòu)成了系統(tǒng)的非線性映射模型。用ANN建模,可將過程或?qū)ο罂闯梢粋€(gè)“黑箱”,只要測(cè)得輸入輸出數(shù)據(jù),就可以建立相應(yīng)的模型,不必象傳統(tǒng)的系統(tǒng)辨識(shí)那樣把過程或?qū)ο蠓譃榫€性系統(tǒng)還是非線性系統(tǒng),也不必對(duì)過程或?qū)ο髢?nèi)部進(jìn)行分析,這對(duì)未知過程的系統(tǒng)辨識(shí)是十分方便的。
中醫(yī)證候體系具有復(fù)雜系統(tǒng)的非線性、開放性、層次性、涌現(xiàn)性和高維性特征,是一個(gè)多維多階多變量的非線性復(fù)雜系統(tǒng)[2-3]。中醫(yī)學(xué)辨證施治過程,實(shí)質(zhì)上是對(duì)大量數(shù)據(jù)信息作出處理,提取規(guī)律的過程。如何從中醫(yī)學(xué)大量現(xiàn)象學(xué)描述中尋找其內(nèi)在規(guī)律,是證的規(guī)范化研究之熱點(diǎn)和難點(diǎn)。以往多采用統(tǒng)計(jì)學(xué)方法,但效果不夠理想。ANN作為一種智能信息處理系統(tǒng),能夠充分逼近任意復(fù)雜的非線性關(guān)系,獲得樣本數(shù)據(jù)的規(guī)則,較好避免數(shù)據(jù)處理中可能摻雜的主觀因素,客觀如實(shí)地反映研究對(duì)象[4],因此,可以將其用于中醫(yī)證候的非線性建模研究。
我們?cè)贛ATLAB7.0環(huán)境下,對(duì)一組RA臨床證候資料建立了基于共軛梯度算法的BP神經(jīng)網(wǎng)絡(luò)證候模型,并用3倍交叉驗(yàn)證的方法進(jìn)行測(cè)試,結(jié)果顯示:該模型具有很好的診斷、預(yù)測(cè)能力。說明ANN能夠充分模擬癥狀與證型診斷之間的非線性映射關(guān)系。這是目前在不打開人體黑箱的前提下,建立非線性證候模型、反映證候的內(nèi)在規(guī)律和特征的有效方法。
BP神經(jīng)網(wǎng)絡(luò)有一個(gè)明顯的缺點(diǎn)是收斂速度非常慢,為此,我們基于共軛梯度學(xué)習(xí)算法,采用trainscg函數(shù)改進(jìn)train函數(shù),從而加快了神經(jīng)網(wǎng)絡(luò)的收斂速度。我們建立的RA證候網(wǎng)絡(luò)模型3次訓(xùn)練的迭代次數(shù)分別為89、56、58,說明通過改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)具有很好的收斂性能。
另外,針對(duì)臨床證候資料多存在兼夾證以及各證型之間有主次之分的情況,我們首先將模型的輸出采用1個(gè)輸出節(jié)點(diǎn)對(duì)應(yīng)1種證型的方式,比如,RA證候模型共有10個(gè)證型,我們將包含10個(gè)證型的輸出采用(0,1,0,0,1,0,0,0,0,0)的方式,其中,括號(hào)內(nèi)每一個(gè)數(shù)值代表一種證型,“0”表示診斷不成立,“1”表示診斷成立,這樣就可以診斷兼夾證了;然后,我們將整合輸出值整理成(0,0.2,0.4,0.6,0.8,1)等6個(gè)等級(jí)的方式,這6個(gè)數(shù)值分別對(duì)應(yīng)原始輸出值的(0-0.1,0.1-0.3,0.3-0.5, 0.5-0.7,0.7-0.9,0.9-1)區(qū)間的數(shù)值,并規(guī)定整合輸出值≤0.4為診斷不成立,≥0.6為診斷成立,這樣就進(jìn)一步根據(jù)整合輸出值的大小直接判斷有幾個(gè)兼夾證以及各證型的主次地位了。可見,我們建立的RA證候網(wǎng)絡(luò)模型不僅能夠利用神經(jīng)網(wǎng)絡(luò)的自主學(xué)習(xí)能力從大量的樣本中抽提出比較全面的證候內(nèi)在規(guī)律,具有良好的診斷、預(yù)測(cè)能力,而且操作簡(jiǎn)便,真正實(shí)現(xiàn)了證候診斷的智能化。ANN技術(shù)是中醫(yī)證候非線性建模的可行性方法。
雖然我們已經(jīng)證實(shí)了ANN用于證候非線性建模的可行性,但是,以目前的技術(shù),還無法從網(wǎng)絡(luò)的聯(lián)接權(quán)中抽提出網(wǎng)絡(luò)通過自動(dòng)學(xué)習(xí)所獲得的證候規(guī)律,今后可以圍繞這個(gè)關(guān)鍵問題繼續(xù)開展研究。另外,證候的診斷信息具有模糊性特征,用模糊神經(jīng)網(wǎng)絡(luò)理論應(yīng)更能夠逼近證候的全貌,我們?cè)?jīng)試圖用模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行證候的非線性建模研究,但是,目前的模糊神經(jīng)網(wǎng)絡(luò)還無法處理證候的兼夾問題,模糊神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果只能是多類中的一類,因此,我們暫時(shí)未作。今后我們將圍繞這方面展開深入研究,力爭(zhēng)建立證候的模糊神經(jīng)網(wǎng)絡(luò)模型。
總之,一門學(xué)科只有不斷地吸納先進(jìn)的思想與技術(shù),在繼承的基礎(chǔ)上發(fā)展創(chuàng)新,才能真正具有生命力。中醫(yī)證候復(fù)雜系統(tǒng)研究,呼喚非線性科學(xué)、人工神經(jīng)網(wǎng)絡(luò)、計(jì)算數(shù)學(xué)、模糊數(shù)學(xué)、信息工程、醫(yī)學(xué)工程、復(fù)雜性科學(xué)等多種邊緣學(xué)科、交叉學(xué)科理論和技術(shù)方法的介入,理論上的探討和不斷切實(shí)可行的實(shí)踐探索并行,才能使中醫(yī)證候規(guī)范研究從量的積累上升到質(zhì)的飛躍。
參考文獻(xiàn)
[1] .中藥新藥臨床研究指導(dǎo)原則(試行)[S].北京:中國(guó)醫(yī)藥科技出版社,2002.115-119.
[2] 白云靜,申洪波,孟慶剛,等.基于復(fù)雜性科學(xué)的中醫(yī)學(xué)發(fā)展取向與方略[J].中國(guó)中醫(yī)藥信息雜志,2005,12(1):2-5.
篇9
中國(guó)式英語是一種很普遍的現(xiàn)象。中國(guó)學(xué)生在英語學(xué)習(xí)的過程中習(xí)慣用漢語的方式來思考問題,并把漢語的應(yīng)用規(guī)律也放到所學(xué)的目的語中,母語在外語學(xué)習(xí)的過程中產(chǎn)生了極大的干擾作用,從而產(chǎn)生了一種不標(biāo)準(zhǔn)的英文變體,這種變體可以表現(xiàn)在語音,詞匯,句法,語篇及語用的各個(gè)方面,這就是人們俗稱的中國(guó)式英語。很多學(xué)者都認(rèn)為,中國(guó)式英語是由于母語文化與目的語文化之間的差異引起的,普遍認(rèn)為中國(guó)式英語是一種不規(guī)范的語言類型(morbid language)。
語言與文化有著密切的聯(lián)系,由于語言的產(chǎn)生和發(fā)展,人類文化才得以產(chǎn)生和傳承。中國(guó)是一個(gè)有著五千年悠久歷史文化的大國(guó)。中國(guó)文化對(duì)于世界的影響力自古就有。作為擁有人口數(shù)量位于世界第一的中國(guó),語言的傳播和影響力是不容忽視的。語言既是文化的載體,又是文化的寫照。文化影響語言,語一言反映文化。由于語言和文化密不可分,語言學(xué)習(xí)和文化學(xué)習(xí)也是不可分的。語言學(xué)習(xí)在文化學(xué)習(xí)中進(jìn)行。沒有語言作為正規(guī)非正規(guī)的學(xué)習(xí)手段,就決不可能學(xué)到任何文化。任何人習(xí)得一種語言的同時(shí),也該學(xué)習(xí)該語言的文化,因?yàn)檎Z言是一種文化的表現(xiàn)形式與承載形式,不了解這個(gè)民族的文化,也就無法真正學(xué)好該民族的語言。所以我們說,學(xué)習(xí)英語就需要了解英語國(guó)家的文化,傳統(tǒng)及風(fēng)俗習(xí)慣,了解中西方文化的差異。
中國(guó)式英語最早產(chǎn)生是在文化傳輸?shù)妮斎胫挟a(chǎn)生的,其根本原因就是缺乏西方文化知識(shí)引起的。絕大多數(shù)的中國(guó)學(xué)生都是在漢語言文化這個(gè)環(huán)境下學(xué)習(xí)英語,中西方文化差異就成為了中國(guó)學(xué)生學(xué)習(xí)英語過程中面臨的最大問題,學(xué)生在說英語或在寫英語作文的時(shí)候所犯的語言錯(cuò)誤有不少其實(shí)是“文化錯(cuò)誤”。所謂“文化錯(cuò)誤”,是指學(xué)習(xí)者所使用的目的語不為口的語國(guó)家的人們所理解或接受。以兩個(gè)最為典型的例子來說明這種情況。
首先是打招呼。用英語打招呼最常用的的是用“hello","good morning","how are you”等用語,隨便的一點(diǎn)可以用“Hi"。但是很多外國(guó)友人或者外籍教師都發(fā)現(xiàn)中國(guó)學(xué)生不太習(xí)慣使用這些打招呼的方式。當(dāng)那些學(xué)生在校園里碰到的時(shí)候,更多的是會(huì)lb]諸如:"Have you eaten?,,或者“Where are you going to?”一類的問題。這些問題讓人很尷尬,也不知道該怎么回答。事實(shí)上這些就是中國(guó)式英語的表現(xiàn),中國(guó)人見面了,都會(huì)用這樣的問候語來互相打招呼。中國(guó)人無視國(guó)外保護(hù)隱私的習(xí)慣,也把這種打招呼的方法用到交流中,勢(shì)必會(huì)造成誤解。
還有一種情況是在面對(duì)別人的贊揚(yáng)的反應(yīng)。當(dāng)英語國(guó)家的人們聽到自己的贊揚(yáng)的時(shí)候,多數(shù)是回答“thank you"。但中國(guó)人聽到贊揚(yáng)的時(shí)候,如果回答謝謝,別人多會(huì)認(rèn)為這個(gè)人不怎么謙虛,甚至覺得太自夸了,所以中國(guó)人一定會(huì)對(duì)別人的贊揚(yáng)表現(xiàn)為自謙或者自我否定。如果不知道中西文化的差異,問題就來了。很多學(xué)生在聽到別人的贊揚(yáng)的時(shí)候,肯定就會(huì)說,"No, I am not good as you say.”等等,初到中國(guó)的不了解文化的外教也會(huì)覺得不知所云。
因此,由于缺乏跨文化意識(shí)而導(dǎo)致的中國(guó)式英語的例子還有很多。這一方面說明了在外來語的學(xué)習(xí)中,文化意識(shí)的培養(yǎng)還相當(dāng)欠缺。用漢語思維來進(jìn)行英語交流時(shí)普遍存在的問題。許多英語老師在講解英語語言知識(shí)和語法知識(shí)的時(shí)候很熟練,但涉及到跨文化交際能力的時(shí)候,就會(huì)出現(xiàn)文化知識(shí)不夠豐富,語用能力隨之較弱的情況。隨著經(jīng)濟(jì)和社會(huì)的發(fā)展以及國(guó)際交往的日益頻繁,對(duì)英語的實(shí)際應(yīng)用能力的要求越來越高,尊重和接納他國(guó)文化就成為交往中不可回避的內(nèi)容。
在英語學(xué)習(xí)中,教師應(yīng)強(qiáng)調(diào)英美文化的導(dǎo)入。學(xué)生在教師的引導(dǎo)下,應(yīng)該逐步積累,意識(shí)到學(xué)習(xí)語言不應(yīng)該只學(xué)習(xí)語法句法,更重要的是了解不同的文化,用所學(xué)語言傳承文化和表達(dá)文化,讓文化融解于語言之中。這也是為什么很多大學(xué)開設(shè)《英美文化》等課程,對(duì)學(xué)生理解所學(xué)語言的文化起到了積極的作用,同時(shí)也幫助學(xué)生更有效的使用語言。
隨著中國(guó)的改革開放和日益與世界接軌的發(fā)展進(jìn)程,越來越多的外國(guó)人在與中國(guó)人的接觸中開始慢慢的接觸中國(guó)式英語,并且認(rèn)可中國(guó)式英語的語法規(guī)則和意義的表達(dá)。
語言習(xí)得的完成,是某種思維方式形成的標(biāo)志。德國(guó)語言學(xué)家,哲學(xué)家洪堡特認(rèn)為,語言不僅有表達(dá)功能,而且還有認(rèn)知功能,是“一個(gè)民族進(jìn)行思維和感知的工具”,每一種語言都包含了一種獨(dú)特的世界觀。因此當(dāng)中國(guó)式英語在表達(dá)中國(guó)特點(diǎn)具有中國(guó)特色的時(shí)候,不可避免的由操漢語的人固有的思維模式和中國(guó)特有的傳統(tǒng)文化影響,在英語中夾帶中國(guó)特點(diǎn),這也是中國(guó)式英語的一種特別的表現(xiàn)形式。
要使英語和中國(guó)特有的社會(huì)和文化也絕不是一件容易的事情。中國(guó)環(huán)境有的東西要想單純通過語言讓對(duì)這一環(huán)境一無所知得人了解,往往還是要費(fèi)一番周折,人們只有通過語言表層,了解其深層的社會(huì)文化內(nèi)涵之后,才能進(jìn)行真正的溝通和相互了解。這也是將中國(guó)傳統(tǒng)文化和現(xiàn)在的社會(huì)文化介紹并傳播的一個(gè)有效途徑。
從詞匯角度出發(fā),中國(guó)式英語這時(shí)是一種輸出性語臺(tái),但不可避免的將文化滲透其中,是英語帶上明顯的中國(guó)特色。諸如氣功,地方戲曲,傳統(tǒng)習(xí)俗和日常生活等方面的許多名稱或術(shù)語,很多是通過音譯在英語中使用。事實(shí)上,很多的漢語借詞早已進(jìn)入英語辭典中,如:wushu,kungfu,quyi,erhu,yamen mahjong等等。
我國(guó)還有豐富的成語,諺語,典故和警句等,怎么樣將它們翻譯成英語是一個(gè)值得探討的問題。比如如果硬將"papertiger"翻譯為“scarecrow"就失去了“紙老虎”這一詞本身所具有的文化底蘊(yùn)。這種情況很多,漢語在外來語的吸入中也注意到了。比如“特洛伊木馬”,“潘多拉盒子”,“鱷魚眼淚”之類的。這樣的互相滲透,不僅是思想的交流,也是語言的交流。
中式英語比較成熟,直接了當(dāng)?shù)卣f事,不拖泥帶水,早就得到國(guó)際承認(rèn),最著名的當(dāng)屬long time no see。英國(guó)作家蕭伯納當(dāng)年曾說過,中國(guó)的洋注洪英語no can(不能)比正宗英語unable (不能)要清晰明了,值得仿效。類似的例子還有“你問我,我問誰”=You ask me, me ask who?
還有些中式英語是在與時(shí)俱進(jìn)的發(fā)展中產(chǎn)生的。截取意義完整準(zhǔn)確的兩個(gè)英語詞匯的一部分構(gòu)成新詞診釋中文時(shí)事詞匯。
篇10
關(guān)鍵詞:跨文化交際,習(xí)語,文化差異,翻譯
1 引言
跨文化交際學(xué)在我國(guó)的歷史很短,但是發(fā)展速度卻相當(dāng)快。隨著翻譯逐漸被認(rèn)同為一種跨文化交際的行為,人們也開始從跨文化交際的角度來研究翻譯。語言是文化的載體,習(xí)語是語言的精華,蘊(yùn)含深厚的文化內(nèi)涵。習(xí)語,是指經(jīng)過人們長(zhǎng)期使用沿襲而提煉出來的形式簡(jiǎn)潔、意義精辟的定型詞組或短語。就廣義而言,習(xí)語包括成語、諺語、俗語、歇后語、俚語、格言等。英語和漢語是高度發(fā)展的語言,歷史悠久,蘊(yùn)含著大量的習(xí)語。然而,英漢文化多方面的差異影響人們正確理解和恰當(dāng)使用習(xí)語。本文將在理解英漢文化差異的基礎(chǔ)上淺析如何處理英漢習(xí)語中形象的翻譯方法。
2 英漢習(xí)語的特點(diǎn)與對(duì)應(yīng)關(guān)系
習(xí)語具有以下特點(diǎn):1、來自民間。具有鮮明的人民性和民族特色;2、習(xí)語是語言的重要修辭手段,也是各種修辭手段的集中體現(xiàn);3、習(xí)語是語言中的特殊成分,它在意義上具有整體性,在語法和邏輯推理上有時(shí)不符合一般的規(guī)律,在用詞上保持相對(duì)固定。
根據(jù)形式和含義相似程度的不同,英漢習(xí)語主要呈現(xiàn)三種對(duì)應(yīng)關(guān)系。
2.1 基本對(duì)應(yīng)
基本對(duì)應(yīng)指的是英漢習(xí)語在意義和用法上大致相同,有的內(nèi)容與形式基本一致,有的內(nèi)容一致,形式有所不同,但總的看來,基本對(duì)應(yīng)。,跨文化交際。英漢習(xí)語的形象和比喻意相似或者甚至相同時(shí),可采用直譯法。如:walls have ears— 隔墻有耳;as light as a feather — 輕如鴻毛;Failure isthe mother of success. — 失敗乃成功之母等。
2.2 部分對(duì)應(yīng)
部分對(duì)應(yīng)是指英漢習(xí)語形象不同但喻意相同或者是形象相同喻意不同。它們或多或少地反映出文化特質(zhì)的相似性。翻譯時(shí)必須小心謹(jǐn)慎,根據(jù)隱含意思而不是字面意思翻譯。因此不能采用直譯法,形象必須改變。如:as strong as a horse — 健壯如牛;to spend moneylike water — 揮金如土;There is no smoke without fire. — 無風(fēng)不起浪等。
以上英漢習(xí)語含義相似,但其中形象完全不同,其中英文習(xí)語中的“horse,water,smoke和fire”分別對(duì)應(yīng)中文習(xí)語中的“牛、土、風(fēng)和浪”。
2.3 基本不對(duì)應(yīng)
英漢習(xí)語中有一些習(xí)語在意義和用法上沒有或很少相似。每個(gè)習(xí)語都有自己的意義和形象,并傳遞著文化色彩。若直譯,將傳遞錯(cuò)誤信息并造成誤解。譯者應(yīng)在完全理解習(xí)語文化內(nèi)涵的基礎(chǔ)上采用意譯法,翻譯出隱含意思。如:talk through one’s hat — 胡言亂語;to be as poor as Job — 家徒四壁;Every dog has his day. — 人人都有得意之日等。
3 英漢習(xí)語的文化差異
習(xí)語好比是一面鏡子,反映出一個(gè)民族或一個(gè)文化的特征。理解英漢習(xí)語背后的文化差異有助于習(xí)語的理解和翻譯及跨文化交際。
3.1 生活環(huán)境
英國(guó)是一個(gè)四面環(huán)水的島國(guó),英國(guó)人喜歡航海,因此很大一部分習(xí)語源于航海事業(yè)。如:to know the ropes (懂得秘訣);all at sea(茫然不知);plainsailing(一帆風(fēng)順)和to rest one’s oars(暫時(shí)歇一歇)等等。
而中國(guó)自古以來長(zhǎng)期是一個(gè)以農(nóng)業(yè)為主的大國(guó),農(nóng)業(yè)人口占很大比例,長(zhǎng)期積累了許多與農(nóng)業(yè)相關(guān)的習(xí)語。如:守株待兔、拔苗助長(zhǎng)、桃李滿天下、瑞雪兆豐年、誰知盤中餐,粒粒皆辛苦、撿了芝麻,丟了西瓜等。
3.2 風(fēng)俗習(xí)慣
英漢風(fēng)俗習(xí)慣的差異是多方面的,較典型的體現(xiàn)在對(duì)動(dòng)物的態(tài)度上。英美國(guó)家把狗當(dāng)作最好的朋友,狗是忠誠(chéng)的象征。許多關(guān)于狗的英文習(xí)語通常帶有褒義,如:top dog — 重要的人;lucky dog — 幸運(yùn)兒;to dog one’ssteps — 跟某人走;Love me, love my dog — 愛屋及烏等。
相反,漢語中狗的形象卻截然不同,通常帶有貶義。中國(guó)民間雖然有養(yǎng)狗的習(xí)慣,但一般在心理上卻厭惡鄙視這種動(dòng)物,常用來形容和比喻壞人壞事。如:狗腿子、狗崽子、狗膽包天、狗急跳墻、狗眼看人低、狗拿耗子——多管閑事等。
3.3 宗教信仰
不同的宗教是不同文化的表現(xiàn)形式,反映出不同的文化特色和不同的文化背景,體現(xiàn)了不同的文化傳統(tǒng)。英文習(xí)語有不少來源于《圣經(jīng)》,與基督教有關(guān)。,跨文化交際。如:Man proposes, God disposes.(謀事在人,成事在天);Whom God wouldruin, he first deprives of reason.(傷天害理,天誅地滅); God help those who help themselves.(自助者天助)等。
而另一方面,中國(guó)文化深受佛教、道教、儒家思想的影響,其中佛教影響最深遠(yuǎn)。習(xí)語明顯地反映出佛教的影響。如:借花獻(xiàn)佛;做一天和尚撞一天鐘;苦海無邊,回頭是岸;泥菩薩過江——自身難保;一個(gè)和尚挑水吃,兩個(gè)和尚抬水吃,三個(gè)和尚沒水吃等。
3.4 歷史典故
英文和中文屬于完全不同的文化體系,發(fā)展遵循不同的歷史軌跡。不少常用習(xí)語來源于歷史事件、神話傳說、寓言故事、民間習(xí)俗等等。一些英文習(xí)語的字面意義和比喻意義都能為中國(guó)讀者所接受,只有充分理解其中歷史文化內(nèi)涵才能正確翻譯。如:a Judas kiss(猶大之吻 —— 背叛行為);crocodile tears(鱷魚眼淚 —— 假慈悲);Trojan horse(特洛伊木馬 —— 暗藏的敵人或危險(xiǎn));Towerof ivory(象牙塔 —— 比喻世外桃源);Sphinx’sriddle(斯芬克司之謎 —— 難解之謎)等。
中文習(xí)語同樣包含提煉自歷史典故的經(jīng)典形象,若不了解習(xí)語的背景歷史文化,多數(shù)人會(huì)迷惑不解,如:四面楚歌、初出茅廬、懸梁刺股、煮豆燃萁、葉公好龍、畫蛇添足、臥薪嘗膽、刻舟求劍、說曹操到曹操就到、身在曹營(yíng)心在漢等等。
4 英漢習(xí)語的翻譯方法
翻譯是用一種語言把另一種語言形式里的內(nèi)容重新表現(xiàn)出來的語言實(shí)踐活動(dòng)。譯文應(yīng)忠實(shí)于原語言的內(nèi)容和形式,正確處理習(xí)語中包含的形象。,跨文化交際。根據(jù)以上分析的三種對(duì)應(yīng)關(guān)系,本文淺析了三種針對(duì)形象處理的翻譯英漢習(xí)語的有效方法,努力再現(xiàn)原語習(xí)語的風(fēng)格和形式。
4.1 保留形象的直譯法
英漢習(xí)語中有少數(shù)基本對(duì)應(yīng)的習(xí)語,彼此在喻義上對(duì)等,形象上巧合,翻譯時(shí)可用譯語中的形象再現(xiàn)原語習(xí)語中的形象來直譯。如:
“Please stop throwingcold water on them”中“throw cold water”有兩種譯文:(1)潑冷水;(2)反對(duì)。,跨文化交際。在保留原語英語形象上譯文(1)明顯比(2)更好,因?yàn)?ldquo;throwcold water”的隱含意思與“潑冷水”相同,且兩者的詞序完全一致。
“隔墻有耳”與“walls haveears”意思一致,都是被其他人無意中或偷聽到秘密的討論。兩者字面意和比喻意相似,且隱含意思相同,所以可以保留隱喻形象直譯。
4.2 轉(zhuǎn)換形象的意譯法
習(xí)語翻譯時(shí)需要忠實(shí)于原語習(xí)語的內(nèi)容和形式,然而當(dāng)無法在譯語中再現(xiàn)原語習(xí)語的形象時(shí),可用符合譯語的表達(dá)習(xí)慣并為譯語讀者所熟悉的形象替換原語的形象,借助譯語中對(duì)應(yīng)的形象,使讀者得到相似的理解。如:“the apple of one’s eyes”中形象“eyes和apple”可轉(zhuǎn)換為“掌上明珠”中的“掌、明珠”;“對(duì)牛彈琴”中形象“牛、琴”可轉(zhuǎn)換為“swine和pearl”正好與“cast pearls before swine”意義相近,譯文讀者能理解,也有利于中英文化交流。
4.3 舍棄形象的意譯法
有些習(xí)語的形象既無法在譯語中再現(xiàn),也無法轉(zhuǎn)換到譯語中,較好的方法是舍棄原語習(xí)語中的形象,在透徹理解原語習(xí)語的基礎(chǔ)上用簡(jiǎn)潔生動(dòng)的語言譯出原語習(xí)語的隱喻意。如:
“During the dog days, hewanted to buy an air-conditioner.”中“dogdays”有兩種譯文:(1)像狗一樣的日子;(2)三伏天或酷熱期。很明顯譯文(2)更確切,意為一年中最熱的時(shí)期,譯文(1)的字面意思曲解了真正的含義。因此,應(yīng)舍棄原語習(xí)語中“dog”的形象,采用意譯法。,跨文化交際。
再如“塞翁失馬,焉知非福”,如果保留原語形象逐字意譯為 “just like the old frontiersman losing his horse,who knows but that this may be a blessing in disguise”,不僅譯文比較長(zhǎng),而且如果讀者對(duì)文化背景一無所知就無法正真理解文化內(nèi)涵。而意譯為 “misfortunemight be a blessing in disguise”或“a loss may turn out to be a gain”,雖舍棄形象但簡(jiǎn)潔易懂。,跨文化交際。
5 結(jié)論
英漢習(xí)語具有鮮明的民族特色,蘊(yùn)含豐富的文化內(nèi)涵。通過理解英漢習(xí)語的文化差異來研究英漢習(xí)語的翻譯,有助于人們探求英漢不同的文化內(nèi)涵,有利于中英跨文化交流。譯者應(yīng)在充分理解習(xí)語文化內(nèi)涵的基礎(chǔ)上,根據(jù)不同語境情況靈活處理習(xí)語中出現(xiàn)的形象,采用適當(dāng)?shù)姆g方法,才能有效表達(dá)出原語的最佳意義,進(jìn)行跨文化交際。
參考文獻(xiàn):
[1]齊華文.論譯者的跨文化意識(shí)[J]. 東華大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2005;5(2)
[2]包惠南,包昂.中國(guó)文化與漢英翻譯[M]. 北京:外文出版社,2004;190-197
[3]馮慶華.實(shí)用翻譯教程[M]. 上海:上海外語教育出版社,2002;1-112
[4]韓保憲.簡(jiǎn)論英漢習(xí)語的三個(gè)對(duì)應(yīng)關(guān)系[J].河南商業(yè)高等專科學(xué)校學(xué)報(bào),2003;16(3)
[5]趙桂華.翻譯理論與技巧[M]. 哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2003;181-184
[6]陳定安.英漢比較與翻譯[M]. 北京:中國(guó)對(duì)外翻譯出版公司,1998;253-255
[7]平洪,張國(guó)揚(yáng).英語習(xí)語與英美文化[M]. 北京:外語教學(xué)與研究出版社,2000;13-110
熱門標(biāo)簽
精品范文
1鱷魚眼淚