GenAI 生成式AI 是什麼?

December 24, 2023

生成式AI 是什麼?

什麼是生成式人工智慧? 生成式AI,也稱為GenAI,允許使用者輸入各種提示來產生新內容,例如文字、圖像、視訊、聲音、程式碼、3D設計和其他媒體。它“學習”並接受在線已有文件和工件的訓練

生成式人工智慧隨著不斷訓練更多資料而不斷發展。它運行在人工智慧模型和演算法上,這些模型和演算法是在大型未標記資料集上進行訓練的,這需要複雜的數學和大量的計算能力來創建。這些資料集訓練人工智慧以人類自己行動或創造的相同方式預測結果。

生成式人工智慧如何運作?

生成式人工智慧模型使用神經網路來識別現有資料中的模式以產生新內容。經過無監督和半監督學習方法的培訓,組織可以從大型、未標記的資料集中創建基礎模型,從本質上形成人工智慧系統執行任務的基礎[ 1 ]。

基礎模型的一些範例包括 LLM、GAN、VAE 和 Multimodal,它們為 ChatGPT、DALL-E 等工具提供支援。ChatGPT 從 GPT-3 中提取數據,並使用戶能夠根據提示產生故事。另一個基礎模型穩定擴散使用戶能夠根據文字輸入產生逼真的圖像[ 2 ]。

流行的人工智慧生成器

您可以熟悉幾個生成式人工智慧平台。您可能會發現它們有助於自動化工作流程中的某些流程。

  • **ChatGPT:**此語言模型以 GPT 架構為基礎,可產生類似人類生成的文字。它是研究、策略和內容創建的有用伴侶。
  • **DALL-E2:**該模型根據文字提示產生圖像,因此創意人員可以創建充滿活力的插圖和概念藝術,這是內容行銷的有用補充。 
  • GitHub Copilot: GitHub 和 OpenAI 之間的合作充當編碼伴侶,幫助開發人員更快、更直觀地編碼。

生成式人工智慧用例

一旦您決定哪種 AI 產生器適合您的需求,這些用例可能會幫助您發揮創意,讓生成式 AI 為您和您的企業帶來好處。

  • 透過產生特定樣式或長度的草稿文字來編寫或改進內容 

  • 添加不同語言的字幕或配音教育內容、影片和其他內容

  • 概述簡報、簡歷、學期論文等

  • 接收通用程式碼進行編輯或改進

  • 總結文章、電子郵件和報告

  • 改進演示或解釋視頻

  • 以特定的音調或風格創作音樂

生成式人工智慧有許多用例可以使我們的工作方式受益,例如加快內容建立過程或減少為調查或電子郵件製定初始大綱所需的工作量。但生成式人工智慧也有局限性,如果不受監管,可能會引起擔憂。

對生成式人工智慧的擔憂

生成式人工智慧的流行伴隨著道德、濫用和品質控制方面的擔憂。由於生成式人工智慧是根據現有來源(包括網路上未經驗證的來源)進行訓練的,因此它可能會提供誤導性、不準確和虛假的資訊。即使提供了來源,該來源也可能包含不正確的資訊或可能被錯誤連結。 

由於 ChatGPT 等生成器允許人類用日常語言輸入提示,因此它變得更容易使用——以至於大學生可能會用它來抄襲或生成論文,而內容創作者可能會被指控竊取原創藝術家的作品。偽造資訊可以讓冒充他人進行網路攻擊變得更加容易。

生成式人工智慧

生成式人工智慧是一種人工智慧技術,可以產生各種類型的內容,包括文字、圖像、音訊和合成資料。最近圍繞生成式人工智慧的熱議是由新用戶介面的簡單性推動的,這些用戶介面可以在幾秒鐘內創建高品質的文字、圖形和影片。

應該指出的是,這項技術並不是全新的。生成式 AI 於 20 世紀 60 年代在聊天機器人中引入。但直到 2014 年,隨著生成對抗網路(GAN)(一種機器學習演算法)的引入,生成人工智慧才可以創建令人信服的真實人物圖像、視訊和音訊。

一方面,這種新發現的功能帶來了機會,包括更好的電影配音和豐富的教育內容。它還釋放了人們對深度偽造(數位偽造影像或影片)以及對企業有害網路安全攻擊的擔憂,包括真實模仿員工老闆的惡意請求。

以下將更詳細討論的另外兩項最新進展在生成式人工智慧走向主流的過程中發揮了關鍵作用:變壓器和它們所實現的突破性語言模型。Transformer是一種機器學習,它使研究人員能夠訓練更大的模型,而無需提前標記所有資料。因此,新模型可以在數十億頁的文字上進行訓練,從而得到更有深度的答案。此外,Transformers 還解鎖了一個名為「注意力」的新概念,使模型能夠追蹤頁面、章節和書籍中的單字之間的聯繫,而不僅僅是單個句子中的單字之間的聯繫。不僅僅是文字:變形金剛還可以利用其追蹤連接的能力來分析代碼、蛋白質、化學物質和 DNA。

所謂的大語言模型(LLM)——即具有數十億甚至數萬億參數的模型——的快速發展開啟了一個新時代,生成式人工智慧模型可以編寫引人入勝的文本、繪製逼真的圖像,甚至創造一些有趣的內容即時情境喜劇。此外,多模式人工智慧的創新使團隊能夠跨多種類型的媒體生成內容,包括文字、圖形和視訊。這是 Dall-E 等工具的基礎,這些工具可以根據文字描述自動建立圖像或根據圖像生成文字標題。

儘管取得了這些突破,但我們仍處於使用生成式人工智慧創建可讀文字和逼真的風格化圖形的早期階段。早期的實現存在準確性和偏差問題,並且容易產生幻覺並吐出奇怪的答案。儘管如此,迄今為止的進展表明,這種生成式人工智慧的固有能力可以從根本上改變企業技術和企業的運作方式。展望未來,這項技術可以幫助編寫程式碼、設計新藥、開發產品、重新設計業務流程和轉變供應鏈。

如何評估生成式人工智慧模型?

成功的生成式人工智慧模型的三個關鍵要求是:  

  1. **品質:**特別是對於直接與用戶互動的應用程序,擁有高品質的生成輸出是關鍵。例如,在語音生成中,語音品質差是難以理解的。同樣,在影像生成中,所需的輸出在視覺上應該與自然影像沒有區別。

  2. **多樣性:**一個好的生成模型可以捕捉資料分佈中的少數模式,而不犧牲生成品質。這有助於減少學習模型中不必要的偏差。

  3. **速度:**許多互動式應用程式需要快速生成,例如即時影像編輯以允許在內容建立工作流程中使用。

如何開發生成式人工智慧模型?

生成模型有多種類型,結合每種結果的正面屬性可以創建更強大的模型。

下面是一個細分:

  • **擴散模型:**擴散模型也稱為去噪擴散機率模型 (DDPM),是在訓練期間透過兩步驟過程確定潛在空間中的向量的生成模型。這兩個步驟是正向擴散和反向擴散。前向擴散過程緩慢地將隨機雜訊添加到訓練資料中,而反向過程則反轉雜訊以重建資料樣本。可以從完全隨機雜訊開始運行反向去噪過程來產生新資料。

擴散和去雜訊過程

圖 2:擴散和去雜訊過程。

擴散模型的訓練時間可能比變分自動編碼器(VAE) 模型要長,但由於這個兩步驟過程,可以訓練數百個(如果不是無限數量的話)層,這意味著擴散模型通常提供最高的性能.建構生成式人工智慧模型時的高品質輸出。

此外,擴散模型也被歸類為基礎模型,因為它們規模大、提供高品質的輸出、靈活,並且被認為最適合通用用例。然而,由於逆向採樣過程,運行基礎模型是一個緩慢而漫長的過程。

在這篇文章中了解有關擴散模型數學的更多資訊。

  • 變分自動編碼器 (VAE):VAE 由兩個神經網路組成,通常稱為編碼器和解碼器。
    當給定輸入時,編碼器將其轉換為更小、更密集的資料表示。這種壓縮表示保留了解碼器重建原始輸入資料所需的信息,同時丟棄任何不相關的資訊。編碼器和解碼器協同工作來學習高效且簡單的潛在資料表示。這使得用戶可以輕鬆地採樣新的潛在表示,這些表示可以透過解碼器映射以產生新穎的數據。
    雖然 VAE 可以更快地產生影像等輸出,但它們產生的影像不如擴散模型那麼詳細。

  • 生成對抗網路 (GAN):GAN 於 2014 年被發現,在最近擴散模型取得成功之前,GAN 被認為是三種方法中最常用的方法。GAN 將兩個神經網路相互競爭:生成器產生新範例,鑑別器學習區分產生的內容是真實的(來自領域)還是假的(生成的)。

這兩個模型一起訓練,並且隨著生成器產生更好的內容而變得更加智能,並且鑑別器能夠更好地識別生成的內容。重複此過程,推動兩者在每次迭代後不斷改進,直到生成的內容與現有內容無法區分。

雖然 GAN 可以提供高品質的樣本並快速產生輸出,但樣本多樣性較弱,因此使 GAN 更適合特定領域的資料生成。

生成模型開發的另一個因素是底層的架構。最受歡迎的之一是變壓器網路。了解它在生成人工智慧的背景下如何運作非常重要。

變壓器網路:與循環神經網路類似,變壓器被設計為非順序處理順序輸入資料。

有兩種機制使 Transformer 特別適合基於文字的生成人工智慧應用:自我關注和位置編碼。這兩種技術都有助於表示時間,並使演算法能夠專注於長距離內單字之間的相互關係

變壓器型號

圖 3:圖像來自 Aidan Gomez 的演示文稿,他是 2017 年定義 Transformer 的論文的八位合著者之一(來源)。

自註意力層為輸入的每個部分分配一個權重。權重表示該輸入在上下文中相對於其餘輸入的重要性。位置編碼是輸入單字出現順序的表示。

變壓器由多個變壓器塊(也稱為層)組成。例如,變壓器具有自註意力層、前饋層和歸一化層,所有這些層一起工作來破解和預測標記化資料流,其中可能包括文字、蛋白質序列,甚至圖像區塊。

集仕多AI主播

集仕多從2020年開始以生成式AI技術製作AI主播,並且提供客製化服務,有20多種語言可以選擇,台語、客家話、原住民語都能通。集仕多提供AIGV生成式影音平臺服務,利用Generative AI、Deep Learning技術建立AI人物模型。有別於市面上競品,我們最新的五代AI主播擁有算圖技術,可在短時間內因應情境需求切換造型,降低影片產製門檻和成本。客製化建模、快速生成造型、應用情境及多語言是我們最大優勢,致力於幫助客戶快速量產影音和影像、創造高質量的內容,提升流量和關注度,領先數位行銷趨勢。

< 回到列表