<em id="5xgjh"></em>
    <nav id="5xgjh"><code id="5xgjh"></code></nav>
  1. <sub id="5xgjh"><address id="5xgjh"></address></sub>
    <form id="5xgjh"></form>
    <sub id="5xgjh"><address id="5xgjh"></address></sub>
      <sub id="5xgjh"></sub>
    1. <nav id="5xgjh"></nav>

        首頁 > 科技部 > 正文
        分享到:

        用AI改變語音市場,3人團隊打下語音技術獨角獸

        時間:2022-09-28 15:19:36 來源:新智元報道 評論:0 點擊:0

          新智元報道

          編輯:桃子

          【新智元導讀】3人團隊如何用AI改變語音市場?

          三人打下的專注語音技術獨角獸,如今又成功融資了。

          前段時間,美國音頻API平臺AssemblyAI完成了3000萬美元的B輪融資。

          這是一個可以自動將音頻和視頻文件以及實時音頻流轉換為文本的平臺。

          AssemblyAI的創始人兼首席執行官Dylan Fox表示,

          但是要知道,能夠得心應手的使用這一技術,其背后語音模型的訓練和語音數據的挖掘分析并不是一個小工程。

          在國內語音市場中,科大訊飛占據鰲頭。在國外,AssemblyAI這一新興初創公司便成功引起了市場的注意。

          2017年,他離開思科,與另外2人一同創立了AssemblyAI,當時僅得到了17萬美元的種子輪融資。

          就比如,他們需要大量的GPU ,因為語音模型的訓練是計算密集型任務。

          幸運的是,他們獲得了知名孵化機構Y Combinator的支持,為他們搭建起了服務器。

          除了硬件方面需要支持,AssemblyAI還需要大量用戶數據進行訓練。因此,他們開發了一個Harvest爬蟲軟件,從網上收集音頻數據。

          經過多年的發展,AssemblyAI已經可以為80多種語言提供基于 API 的人工智能服務。

          此外,它還能夠提供多種模型供企業使用,比如情感分析模型、實體檢測模型、內容審核模型等。

          現在,華爾街日報,Spotify,BBC等知名公司都是它的客戶。

          關于AssemblyAI更多了解,可以聽聽Fox怎么說。

          AssemblyAI創始人采訪

          以下內容是對AssemblyAI創始人兼首席執行官Dylan Fox的最新采訪:

          最初是什么吸引你進入機器學習的?

          是從學習如何編程,并在大學期間參加了華盛頓特區的Python聚會開始的。大學的課程讓我發現自己更傾向于算法類型的編程問題,自然而然地將我引向了機器學習和 NLP道路。

          在創立 AssemblyAI 之前,當時您在思科擔任高級軟件工程師,主要做什么工作?

          作為思科一名高級軟件工程師,我主要專注于協作產品的機器學習。

          創立AssemblyAI的公司的想法便是從這里開始的。

          構建這些技術還需要一種專業技能,這就是為什么客戶來找我們來尋求我們在內部研究、訓練和部署強大AI模型的一個重要原因。他們可以通過簡單的 API 獲得對 ASR 和 NLP 的最先進 AI 模型的多年研究。

          除了純粹轉錄音頻和視頻內容之外,AssemblyAI還提供了其他模型,您能介紹一下這些模型是什么嗎?

          AssemblyAI的人工智能模型套件不僅限于實時和異步轉錄。我們將這些附加模型稱為音頻智能模型,因為它們可以幫助客戶分析和更好地理解音頻數據。

          摘要模型提供了一個整體摘要,以及時間編碼的摘要,這些摘要會隨著對話中的主題發生變化,自動分割并為每個章節生成摘要。

          情感分析模型可以檢測音頻文件中每句話的情感,每個句子都可以標記為正面、負面或中性。

          主題檢測模型標記音頻和視頻文件中所說的主題。預測的主題標簽遵循標準化的 IAB 分類法。

          內容審核模型可檢測音頻和視頻文件中的敏感內容,例如仇恨言論、暴力、敏感的社會問題等等。

          對于使用AssemblyAI的公司來說,最大的用例是什么?

          電話、視頻、虛擬會議和媒體。

          CallRail 是電話領域客戶的一個很好的例子,它利用 AssemblyAI 的人工智能模型ーー核心轉錄、自動轉錄亮點和 PII 編輯ーー向客戶提供強大的對話智能解決方案。

          基本上,CallRail現在可以大規模地自動顯示和定義他們給客戶電話中的關鍵內容,例如特定的客戶請求、常見問題以及常用的關鍵詞和短語。

          我們的 PII 編輯模型可以幫助他們自動檢測和刪除記錄文本中的敏感數據(如社會安全號碼、信用卡號碼、個人地址等)。

          在視頻方面,從視頻流平臺到 Veed 等視頻編輯器都是使用的 AssemblyAI 的核心轉錄模型來簡化用戶的視頻編輯過程。

          Veed還允許其用戶轉錄其視頻并使用字幕直接對其進行編輯。

          AssemblyAI最近完成了3000萬美元的B輪融資。未來將如何加速AssemblyAI的使命?

          人工智能領域正在取得的進展令人難以置信。我們的目標是通過一組簡單的 API 將這一進展向互聯網上的每個開發人員和產品團隊公開。

          隨著我們繼續研究和訓練用于 ASR 和 NLP 任務的最新人工智能模型,我們將繼續通過簡單的 API 向開發人員和產品團隊免費提供這些人工智能模型。

          過去的6個月,我們推出了對15種新語言的 ASR 支持——包括西班牙語、德語、法語、意大利語、印地語和日語,發布了對我們的摘要模型、實時 ASR 模型、內容審核模型和其他產品的更新。

          我們幾乎沒有用過首輪融資,但這筆新融資將使我們能夠積極擴大我們的努力。

          有了這筆新的資金,我們將能夠加速推動產品路線圖,建立更好的人工智能基礎設施以加速我們的人工智能研究和推理引擎,并擴大我們的人工智能研究團隊?,F在團隊成員就有來自DeepMind、谷歌大腦、Meta AI、寶馬和思科的研究人員。

          我們的使命是通過簡單的 API,讓開發人員和產品團隊能夠大規模地使用最先進的 AI 模型。

          參考資料:

          https://www.unite.ai/dylan-fox-ceo-founder-of-assemblyai-interview-series/

          https://medium.com/@ShenzhenWare/assemblyai-%E6%83%B3%E8%AE%93%E4%BA%BA%E4%BA%BA%E9%83%BD%E8%83%BD%E5%81%9A%E5%AE%9A%E5%88%B6%E5%8C%96%E8%AA%9E%E9%9F%B3%E8%AD%98%E5%88%A5-%E9%9B%96%E7%84%B6%E4%BB%96%E5%80%91%E5%8F%AA%E6%9C%89%E4%B8%89%E5%80%8B%E4%BA%BA-f7d5c055c82b

        美女精品一区二区