日韩av片子_国产自在自线午夜精品视频在_使劲快高潮了国语对白在线_久久免费毛片大全_激情丁香综合_欧美成人精品欧美一级乱黄码

中培偉業(yè)IT資訊頻道
您現(xiàn)在的位置:首頁 > IT資訊 > 人工智能 > 自然語言處理:向商人解釋BERT

自然語言處理:向商人解釋BERT

2020-07-29 17:27:31 | 來源:中培企業(yè)IT培訓(xùn)網(wǎng)

BERT對于NLP而言無疑是向前邁出的重要一步。諸如主題檢測和情感分析之類的業(yè)務(wù)活動將更易于創(chuàng)建和執(zhí)行,結(jié)果也將更加準(zhǔn)確。但是如何找到BERT的,該模型是如何工作的呢?為什么這么強(qiáng)大?最后但并非最不重要的一點是,它可以為業(yè)務(wù)帶來什么好處,以及決定將其集成到 sandsiv +客戶體驗平臺中的呢。這些問題很難,我為自己設(shè)定了一個目標(biāo)。向既沒有編程知識又沒有人工智能背景的人們講解。挑戰(zhàn)很大,會盡力而為。

今天早上,我想起了學(xué)習(xí)葡萄牙語的新語言。我喜歡這種語言的聲音,我對自己說,讓我們學(xué)習(xí)吧。我想到的第一件事是要用葡萄牙語翻譯成葡萄牙語,以建立第一個基本詞匯。

之所以很有趣,是因為某些單詞聽起來很像意大利語,在意大利語的背景下,我試圖將事物理解為同義詞和自主語,以使其看起來比它們的真實氣味更香。因此,我試圖理解單詞之間關(guān)系的語義或含義。

實際上,我使用一種我熟知的語言-我的母語-然后關(guān)聯(lián)了這些新的葡萄牙語術(shù)語并慢慢學(xué)習(xí)了這種新語言。由于深度的機(jī)器學(xué)習(xí)和計算能力的顯著提高,在計算領(lǐng)域已經(jīng)完成了類似的過程。

計算機(jī)只知道一種語言,數(shù)學(xué),因此如果要“教”機(jī)器對人類語言的解釋,則必須參考。

重要的是要記住,深度學(xué)習(xí)解決的任何問題都是數(shù)學(xué)問題。例如,借助卷積神經(jīng)網(wǎng)絡(luò),計算機(jī)可以“看到”。該CNN接收數(shù)學(xué)矩陣形式的圖像,然后應(yīng)用線性代數(shù)規(guī)則。在諸如主題檢測,情感分析等任務(wù)中也是如此。

如果有人為您提供對語言敏感的NLP解決方案,但問題出在數(shù)學(xué)上,而不是語言上,知道它可能已經(jīng)存在了四代,甚至更糟: 關(guān)鍵字搜索解決方案。

在計算機(jī)世界中, 向量嵌入程序已解決了將一個未知單詞轉(zhuǎn)化為嘗試學(xué)習(xí)的已知語言的問題。諸如FasText,Word2Vec和GloVe之類的算法正是這樣做的:將任何語言的單詞轉(zhuǎn)換為計算機(jī)可以通過線性代數(shù)“理解”的數(shù)學(xué)矢量。再一次,這是一個數(shù)學(xué)問題,而不是語言問題。

我學(xué)習(xí)葡萄牙語的下一步是翻譯小句子。我仔細(xì)聽了每個葡萄牙語單詞,將其翻譯成意大利語。每個新單詞的線性運(yùn)算與我的翻譯工作相吻合。在計算機(jī)世界中,相同的操作是通過稱為Encoder和Decoder的算法完成的。

該系統(tǒng)依次“收聽”“單詞”,將其轉(zhuǎn)換為新的指令,包括語言到語言的轉(zhuǎn)換以及“理解”的計算模型。

當(dāng)然,這使我可以將葡萄牙語中的小句子翻譯成意大利語,但是當(dāng)句子變長甚至變成完整的文檔時,此時逐詞系統(tǒng)已無法很好地工作。我必須提高專心致志的能力,并試圖更好地理解葡萄牙語中每個新單詞的呈現(xiàn)背景,當(dāng)然,這與我的意大利語知識相關(guān)。

這比我以前使用的逐字方法多了一步。即使在計算世界中,下一步就是在Encoder-Decoder模型中添加所謂的 “注意力機(jī)制” ,該機(jī)制使計算機(jī)可以更加關(guān)注上下文中的單詞。實際上嘗試應(yīng)用線性過程中缺少的那些語義規(guī)則。

盡管關(guān)注的程度有所提高,但該方法始終是順序的,并且清楚地表明了其局限性。就我而言,每一個來自葡萄牙語的新單詞,我都會嘗試用意大利語閱讀它,這引起了很多關(guān)注,但是我不得不說,由于語言的某些歧義,我很難正確地解釋它們。在計算機(jī)上,模型很難理解復(fù)雜的語義規(guī)則的情況也是如此。

我不得不說,我從葡萄牙語到意大利語的翻譯水平已大大提高,盡管有一些錯誤,但我可以翻譯比以前使用的方法更長的句子。但是,在這一點上,我需要更多,我想更快,更精確。我想更好地理解上下文。我想減少歧義。我需要某種并行過程以及上下文知識,最后,我需要了解長期依賴關(guān)系。

我的計算過程與我的需求完全相同,這就是 變形金剛的 用武之地。

讓我們舉個例子,讓我們看看這兩個句子:

· 我去銀行開了一個帳戶。

· 該船已接近銀行。

完全相同的單詞“ bank”在兩種情況下都有兩種含義會發(fā)生變化。您需要從整體上看這句話,以了解其語法和語義。 語言模型的ELMo嵌入會 查看整個句子,以了解語法,語義和上下文,以提高NLP任務(wù)的準(zhǔn)確性。

為了更好地學(xué)習(xí)葡萄牙語,我的下一步是閱讀大量書籍,收聽葡萄牙語電視節(jié)目,觀看葡萄牙語電影等。我試圖顯著提高自己的詞匯量,了解該語言及其依賴性。

我的電腦做同樣的事情。例如,它已經(jīng)用葡萄牙語“閱讀并記住”了所有Wikipedia,從技術(shù)上講,它做了所謂的“ 轉(zhuǎn)移學(xué)習(xí)”。這樣,當(dāng)我的計算機(jī)必須以葡萄牙語執(zhí)行任何語言操作時,就不再從頭開始,而是以該語言創(chuàng)建了相當(dāng)廣泛的知識。

從大量單詞中“學(xué)習(xí)”到對語言有很強(qiáng)的初步理解的模型稱為 生成預(yù)訓(xùn)練變壓器。該模型僅使用Transformer的解碼器部分。它使用從閱讀中學(xué)到的知識,例如Wikipedia,并從左到右“閱讀”單詞。

當(dāng)您學(xué)習(xí)語言的不同方面時,您會意識到,接觸多種文本對于應(yīng)用遷移學(xué)習(xí)非常有用。開始閱讀書籍以建立強(qiáng)大的詞匯量和對該語言的理解。當(dāng)句子中的某些單詞被掩蓋或隱藏時,請依靠您對語言的了解,從左到右和從右到左閱讀整個句子。

現(xiàn)在,您可以更準(zhǔn)確地預(yù)測被屏蔽的單詞。這就像填補(bǔ)空白。您還可以預(yù)測兩個句子何時相關(guān)。這是一個簡單的BERT代表來自變壓器的雙向編碼器表示(BERT)是瀏覽器公司開發(fā)的NLP預(yù)訓(xùn)練技術(shù)。它的工作可以從首字母縮略詞一目了然:變壓器編碼器的雙向表示。

你困惑嗎?不用擔(dān)心,我也是。我只會嘗試從實際的角度解釋BERT的真正優(yōu)勢。

在我們之前看到的所有事情中,BERT是一個巨大的進(jìn)步。它收集了以前模型的所有功能,從詞嵌入到轉(zhuǎn)換器,以及它們實現(xiàn)的所有優(yōu)點。但這帶來了其他非常有趣的實踐創(chuàng)新:

BERT是雙向的,它不只是從左到右的“讀取”,而是相反的。這使它可以更好地“理解”上下文中的單詞。不僅對于歧義詞,而且對于相關(guān)詞,例如:M登上了舞臺。他玩得很開心!BERT理解“他”是指M,這對解決語言問題來說不是一件小事。BERT在訓(xùn)練時不僅會“閱讀”,而且會隱藏15%的單詞并嘗試“猜測”它們。

通過這種方式,他嘗試創(chuàng)建超越“閱讀”范圍的知識,但可以幫助BERT根據(jù)先前的上下文來預(yù)測單詞,甚至可以根據(jù)先前的上下文來預(yù)測句子。例如,在自動問答系統(tǒng)或聊天機(jī)器人中,這并不是一件小事。BERT提供了幾種通用模型,這些模型可以“上載”,然后進(jìn)行微調(diào)以適應(yīng)特定情況,而無需海量數(shù)據(jù)進(jìn)行微調(diào)。

對于那些已經(jīng)嘗試通過標(biāo)記數(shù)據(jù)來訓(xùn)練NLP模型的人來說,這不是一件小事。

我從事自然語言處理已經(jīng)有好幾年了-真實的東西,而不是我的競爭對手因文本挖掘而失去的關(guān)鍵字搜索-我對BERT印象深刻。讓我給您一個小的實際例子。我建立了一個情感模型,根據(jù)這樣構(gòu)成的數(shù)據(jù)集,最終精度為F1 89%:

· 1270快樂

· 154淡然

· 26生氣

· 11無聊

· 3沮喪

所有這一切都是可能的,因為通過使用Transfer Learning和BERT提供的通用模型,即使是很小的情況也可以進(jìn)行微調(diào)。實際上,就像您可以在大腦中加載一個模型一樣,該模型總結(jié)了通過閱讀所有葡萄牙語獲得的Wikipedia所獲得的語言知識,然后對要解決的特定情況進(jìn)行了一些微調(diào)NLP的飛躍!

我忘記了,BERT顯然提供了許多用于遷移學(xué)習(xí)的模型。它顯然提供了多種語言。例如,基于BERT的多語言案例模型可使用104種不同的語言“閱讀文本”,并且每種語言都可以使用自己的小型數(shù)據(jù)集進(jìn)行完善。

BERT很快將在我們的sandisv +解決方案中可用 ,并且我們的客戶將能夠利用這項偉大的創(chuàng)新帶來的主題檢測和情感分析帶來的所有這些好處。想了解更多關(guān)于自然語言處理的信息,請繼續(xù)關(guān)注中培偉業(yè)。

標(biāo)簽: 自然語言處理 人工智能
主站蜘蛛池模板: 经典久久久久 | 国产中文字幕视频在线观看 | 久久精品熟女人妻一区二区三区 | 亚洲精品一区二区无码夜色 | 亚洲区欧美 | 欧美亚洲另类图片 | 无码人妻出轨黑人中文字幕 | 国产精品国产三级国产普通话99 | 国内一区二区在线 | 欧美日韩国产综合草草 | 巨爆乳无码视频在线观看 | 久久和欧洲码一码二码三码 | 国产一级毛片视频 | 最近更新中文字幕视频 | 国产草莓精品国产av片国产 | 麻豆视频在线看 | 成人午夜免费福利视频 | 成人无码α片在线观看 | 亚洲VA在线VA天堂XXXX中文 | 日韩和一区二区 | 成人日韩在线 | 亚洲国产精品人人爽夜夜爽 | 久久亚洲欧美日韩精品专区 | 精品久久久久久无码专区不卡 | 国产一级片久久 | 天天综合网久久综合免费人成 | 日韩中文字幕成人免费视频 | 色秘?乱码一区二区三区唱戏 | 久久久久久久久蜜桃 | 久久无码AV一区二区三区 | 亚洲AV最新在线网址 | 久久中文字幕在线观看 | 巨大黑人video | 国产伦子系列沙发午睡 | 国产日韩精品一区 | 欧美日韩性生活片 | 激情爆乳一区二区三区 | 国产网站一区二区 | 狠狠色狠色综合曰曰 | 久久精品18 | 久久草视频 |