AI與機器學習對電視製作和播出的影響?

December 15, 2021

將大數據轉換為實時可行的分析

VionLabs 的情感指紋 API 使用計算機視覺和機器學習來生成情感數據。

**渥太華——**趨勢警報:人工智能/機器學習 (AI/ML) 正在成為整個電視製作/播出過程中不可或缺的一部分。

“人工智能/機器學習正在轉向為廣播公司和內容製作商提供巨大價值,AI電視台的形成指日可待,”位於弗吉尼亞州麥克萊恩的實時影片分析市場研究員 IdenTV 的聯合創始人兼首席運營官 Amro Shihadah 說。“人工智能/機器學習通過將大數據從成本中心和不透明的結構化/非結構化數據集轉換為實時可操作的分析和大數據搜尋和召回工具,創造更好的使用者體驗並從新內容中產生收入來實現這一目標分銷管道。”

廣播顧問加里奧爾森剛剛發布了他的書“規劃和設計 IP 廣播設施——一個新的難題”的第二版,他說這項技術已經出現在生產鏈的各個元素中,預計擴大其足跡。

“我認為 AI/ML 將在 2020 年出現在編輯、圖形和媒體管理產品中,”奧爾森說。隨著時間的推移,“看看哪些供應商聲稱他們的產品具有人工智能或機器學習將會很有趣。”


許多主要的廣播公司和電視工作室都擁有龐大的圖書館,可供直接面向消費者的在線銷售。挑戰在於確定這些節目中哪些會吸引現代消費者以及出於何種原因,而無需讓員工實時觀看所有節目。

據該公司稱,Prime Focus Technologies 的 CLEAR Vision Cloud 擁有一個基於雲的 AI 引擎,可以在多個搜尋變量中以“創紀錄的時間”完成這項工作。

PFT 人工智能和機器學習副總裁 Muralidhar Sridhar 說:“可能有一個人工智能引擎可以識別影片中的人臉。” “另一個人可能會看到標誌性的聲音,‘比如說,一個人在水里濺水’,而第三個人則在尋找不同的物體。最棒的是,我們的 AI 可以實時完成人類需要數小時才能查看一段內容的工作。”

Primestream 的產品開發總監 Alan Dabul 表示,Primestream 的 Xchange 平台使用 AI/ML 為其內容髮現工具提供動力,在此過程中提供了廣泛的搜尋選項。

“你不僅可以將搜尋範圍縮小到特朗普總統,還可以縮小到他談論稅收的那些具體片段,”他說。“然後你可以將搜尋範圍進一步縮小到他在辦公室環境中談論稅收的時候,然後看看當時誰和總統在一起。”

體育和現場活動

考慮到必須即時創建多少內容,體育和其他現場活動是廣播公司最勞動密集型的製作之一。Tedia 的 SMARTLIVE 元數據引擎使用 AI/ML 來自動化與這些作品相關的媒體管理任務;包括元數據標記、自動剪輯創建和現場活動期間向數字平台和社交媒體分發。SMARTLIVE 還可以管理多場地饋送並支持多個即時內容搜尋,以將檔案素材集成到現場廣播中。

Tedial 產品副總裁 Jerome Wauthoz 表示:“SMARTLIVE 允許製作團隊使用相同的預算和相同的團隊創建更多內容,從而增加粉絲參與度和額外收入。“SMARTLIVE 還直接連接到現有的生產環境,因此我們的客戶可以使用他們當前的基礎架構來攝取、編輯和交付內容;不需要額外的投資。”

字幕和翻譯

AI電視台的其中內容部份,必然少不了字幕製作及翻譯,AI/ML 獲得關注的另一個勞動密集型領域是多語言字幕。使用語音到測試 AI 系統,供應商可以從內容的音頻中自動生成文字內容字幕,並在同一數據流中以多種語言提供它們。

IBM Watson Media 高級產品經理 Brandon Sullivan 表示:“這些算法經過訓練,可以實時從數據中學習,吸收當地術語和方言以獲得最佳字幕體驗。” “隨著人工智能和機器學習訓練能力的提高,當地方言、地名和具體名稱,以及個別說話者的聲音都將被準確捕捉。在未來,這不僅會改變隱藏式字幕,還會改變自動翻譯、影片索引等。”

廣告

字幕和口型同步是兩種 AI/ML 技術,作為 Interra Systems 的影片質量控制平台 BATON 的一部分。“借助 AI/ML,你可以提高字幕的準確性和速度,這是一個資源密集型、耗時的過程,”位於矽谷的影片質量控制和監控提供商的產品管理副總裁 Anupama Anantharaman 說技術。“它在檢測‘口型同步’方面也特別有效;螢幕上嘴唇的運動與所說的內容之間的對齊。”

Telestream 的 Telestream Cloud 包括字幕作為其許多基於雲的 AI/ML 產品;據該公司的雲產品經理 Remi Fourreau 稱,其他問題是針對多個交付平台的影片轉碼和質量/合規性檢查。

“我們使用許多基於雲的提供商的語音到文字內容功能來生成多種語言的準確字幕和字幕,”Fourreau 說。“這是人工智能/機器學習在準確高效地完成任務方面真正發揮作用的領域。”

ENCO 的 enCaption4 平台為直播和預先錄製的電視內容實時提供自動隱藏式字幕,並將人工智能驅動的機器學習與神經網絡語音到文字內容引擎相結合。除了通過 AI 教授獨特單詞的新聞編輯室摘要導入之外,enCaption4 還可以教授特殊單詞,例如主持人和演員姓名以及本地和區域術語。其他 AI 驅動的增強功能改進了標點符號和大寫的字幕。

“enCaption 可以準確地拼寫從攝取的列表和腳本中學到的不尋常的單詞,而無需為每個說話者創建語音模式配置文件,”ENCO 總裁 Ken Frommert 說。“這對於新聞操作自動化和字幕來自各種主播、記者、氣象學家和演播室客人的演講來說是一個重要的好處。”

壓縮

影片壓縮一直是數據速率降低和影片質量之間的平衡。通過 VOS360 直播平台等基於 AI 和 ML 的雲解決方案,Harmonic 旨在更有效地實現這種平衡。

“我們的 PURE 壓縮引擎使用 AI/ML 來改進管理影片壓縮的算法,”高級產品行銷經理 Jean-Louis Diascorn 說,他領導 Harmonic 的 AI/ML 影片壓縮進步。“與使用人類工程師相比,使用 AI/ML 實現這些改進要快得多。我們繼續在去年 NAB BEITC 上展示的工作取得進展,現在的目標是解決密度方面的問題。”

推薦引擎

廣告

亞馬遜、Netflix 和 YouTube 等流媒體服務使用支持 AI/ML 的推薦引擎來挖掘觀眾當前的內容選擇,並使用他們發現的內容推薦可能感興趣的類似節目。Vionlabs 的支持 AI/ML 的內容髮現平台旨在幫助廣播公司評估他們自己的內容庫,專注並提高他們的在線直接面向消費者的銷售。

“高質量的數據可以幫助廣播公司更多地了解他們的內容,並在整個內容週期中做出更明智的決策,”這家瑞典影片發現技術提供商的首席執行官馬庫斯·伯格斯特倫 (Marcus Bergström) 說。“這方面的一個例子是內容推薦,讓廣播公司更深入地了解成功的節目如何吸引觀眾。它還可以幫助他們自動遵守流域後內容的法規。”

上個月,該公司推出了“情感指紋 API”,以幫助媒體公司根據 AI 生成的影片數據和見解做出更好的決策。據該公司稱,情感指紋 API 使用計算機視覺和機器學習來生成情感數據,根據 Vionlabs 的推薦創建獨特的個人觀眾體驗。

情感指紋 API 已被開髮用於測量影片篩選過程中的數千個因素,包括顏色、節奏、音頻和對象識別,以便逐幀生成代表內容情感結構的 AI 衍生指紋。

有限制

支持 AI/ML 的系統現在在電視製作/播出流中扮演著許多角色。但他們不能做所有事情;至少現在還沒有。

Anantharaman 說:“要使機器學習工具有效工作,你需要不斷微調模型並需要大量準備好的數據。” “將會出現需要人工干預的具有挑戰性的情況。然而,對於大多數內容,AI/ML 可以提供極高的準確性。”

< 回到列表