狄慧,2001年考入中國著名高等學府——大連理工大學,學習計算機應用專業。2004年取得碩士學位后在一家日本企業做了7年左右的對日軟件開發的工作,爾后于2011年加入東芝中國研究開發中心,從事機器翻譯與口語對話系統的研發與管理等工作。目前她身兼東芝中國研究開發中心口語對話部門與機器翻譯&自然語言處理部門兩個部門的部門長職務。
和我們談談你自己。
我自學生時代起就對計算機和外語產生了濃厚的興趣,可能這兩個愛好也為我從事目前的工作埋下了種子吧。從進入大學學習開始到工作的這20余年,也算親眼見證并參與了計算機技術從信息化數字化到智能化的發展。我曾參與過多個面向日本用戶的系統開發項目,當我看到這些系統被實際運用后帶給人們便利、帶給企業利益的時候,我便體會到了自身工作的價值。
是什么讓你對工作充滿激情?
不斷涌現的新技術與新需求帶來的挑戰與新鮮感使我對工作始終保持熱情。東芝倡導的開放自由的研發環境,使我有機會與一群充滿才能的同事并肩協作,研發出高性能的技術與產品,為企業與社會做出貢獻,同時實現個人成長。我們的團隊提交了多項關于機器翻譯等自然語言處理技術的論文和專利,研發的技術也在東芝研發中心技術展上參展并獲得認可,這些成就既是對我們當前工作的肯定,也是敦促我們持續向前的動力。
如今,在這個智能化時代,自己能有幸參與到東芝口語對話和機器翻譯技術的研發,不斷學習新知識、致力于做出有價值的技術,是一件十分幸福的事。這種新鮮感與挑戰也是工作的樂趣。
有沒有一條東芝理念曾讓你產生共鳴,激勵你的工作或是個人生活?
創新求變。新時代,人工智能技術日新月異,比如,機器翻譯技術從之前的基于規則到后來的基于統計再到近幾年的神經網絡機器翻譯,發展變化速度很快,我們需要及時響應變化,擁抱新技術,不斷創新,致力進行實用產品的技術研發。
還記得去年,我們開發的神經網絡機器翻譯技術與東芝研發中心(下稱RDC)開發的演講實時字幕系統結合,提供實時字幕翻譯功能。在很短的時間內我們集成了翻譯模型,但在實際應用中我們發現既有的翻譯模型在翻譯演講內容時存在“專業詞翻譯質量差”的問題。為此,我們在短時間內試驗多種性能改善方法,最終通過用戶詞典的插入與混合型領域適應方法,大大提高了專業領域句子的翻譯性能,同時在通用領域保持較好的性能。改進后的翻譯服務在JSAI2019(日本人工智能學會),東芝RDC2019技術展專題演講等中獲得好評。
這樣的例子在研發工作中數不勝數,時刻提醒著我們——始終尋找更多可能,不滿足于僅僅一個答案。
為實現“為了人類和地球的明天”這一理念,你們做過怎樣的努力?
隨著全球化浪潮不斷推進,中國的語言服務市場規模龐大。一方面,中國智能設備普及率高,擁有海量用戶和多維度的海量數據。例如機器翻譯技術已廣泛應用于本地化,同聲傳譯,翻譯機等,又如,口語對話技術在語音交互,智能客服等應用中不可或缺。
另一方面,市場廣闊的同時競爭同樣激烈,我們致力于服務于垂直領域的差異化技術的研發。作為東芝機器翻譯技術的研發主力,我所在的團隊承擔著重要的責任。目前,我們團隊與高校展開積極合作,全力研發神經網絡機器翻譯翻譯結果的質量自動評測與自動編輯算法。此研究有助于推動機器翻譯的應用,未來,深耕應用技術研發領域,并使之早日產品化是我們的奮斗目標。
有什么想對你一同奮斗的小伙伴們說的么?
讓我們一起追求創新,不斷進步,成就美好未來。讓語言技術更好地服務于人。