Summary
Overview
Work History
Education
Skills
Project
Timeline
Generic

WEN PING ZHU

New Taipei

Summary

ソフトウェアエンジニアとしての4年以上のキャリアを通じて、豊富なプログラミング開発経験を積むだけでなく、新しい知識を継続的に吸収し、現実に即した解決策を求める精神を学びました。音声認識および大規模言語モデルの分野でさらに深く専門知識を積み、専門性と経験を活かして会社が直面する未知の問題を解決することを期待しています。

Overview

8
8
years of professional experience

Work History

Software Engineer

Micro-Star International
11.2019 - Current

音声認識(ASR)モデルのカスタマイズ:

  • システムプラットフォーム:Kaldi、Wenet、Nemoなどのプラットフォームを使用し、音声認識システムの深いカスタマイズと最適化を行っています。
  • 音響モデルのファインチューニング:異なるアクセント(例えば台湾アクセント)に特化した調整が可能で、台湾市場への応用において音声認識の精度を大幅に向上させました。
  • 言語モデルの開発:様々なアプリケーションシーンに適応するため、異なる顧客ニーズに合わせたカスタマイズされた言語モデルを開発しています。
  • 適用分野:トレッドミル、ロボット、自動移動ロボット(AMR)など、多様なプロジェクトに成功を収めています。

キーワード検出(KWS)技術の開発:

  • 音声データ処理:音声データのクリーニングとトレーニングデータの強化を体系的に行っています。
  • モデル研究:効率的なキーワード検出モデルを研究・開発し、キーワード認識の精度を顕著に向上させています。
  • 後処理開発:後処理技術を開発し、認識結果の品質と誤認率をさらに向上させています。

大型語言模型的研究與開發(LLM):

  • モデルのファインチューニング:特定のアプリケーションシーンにおいて、最適な性能を達成するためのモデルのファインチューニングを行っています。
  • RAG開発:検索強化ジェネレーター(RAG)を研究・開発し、低コストかつ迅速にモデルの回答の精度を向上させています。
  • モデル評価:モデルの性能を総合的に評価し、期待される効果を達成しています。
  • Prompt Engineering:指示の技巧を洗練させ、モデルの回答内容を最適化しています。


Testing Engineer

安富科技股份有限公司
10.2015 - 10.2016

BluetoothおよびWiFiの信号測定:

  • 最適な性能と接続性を確保するため、BluetoothとWiFiの信号測定を行います。

互換性およびストレステスト:

  • 主要ブランドのスマートフォンと会社の車載機器製品間の互換性をテストし、シームレスな統合と操作を保証するためにストレステストを実施します。

問題の確認および問題の再現:

  • クライアントが指摘した特定の問題を確認し、パケットをキャプチャするために状況を再現します。

Education

Master of Science - Physics

国立台湾師範大学
Taipei, Taiwan
04.2001 -

Bachelor of Science - Physics

輔仁大学
New Taipei, Taiwan
04.2001 -

Skills

    Python

undefined

Project

ロボット指令の言語モデル制作 (2020年10月~2021年1月)

  • ロボットプロジェクト用の言語モデルを制作し、ロボットが必要とする指令を生成。フ
  • ァインチューニング技術を通じて全体の誤操作の可能性を低減。

配膳ロボット (2022年2月~2022年8月)

  • 配膳指令を言語モデルに変換し、複数言語(英語、中国語など)のモデルを制作。
  • CRFアルゴリズムを使用して、文のintent(意図)とentity(実体)を識別。

台湾アクセントにおける音声モデルのファインチューニング (2022年12月~2023年1月)

  • 少量(50時間)の台湾アクセントの音声ファイルを用いて、中国語の音響モデルを微調。
  • 元の精度92%から96%へ向上。

音声認識キーワード検出の開発 (2023年4月~2023年8月)

  • トレーニングデータの拡張技術を用いて、トレーニングセットのデータ量とモデルの汎化性を増加。
  • キーワード検出の誤検出率を低減するための後処理技術を追加。
  • モデルを低消費電力の組み込みプラットフォームにデプロイ可能。
  • 誤検出率を元の15%から3%へ低減。

GTCロボットプロジェクト (2023年10月~2024年1月)

  • 2024年NVIDIA GTC大会で展示されるロボットの音声認識部分を担当。
  • 言語モデルの調整およびintentとentityの識別を行う。
  • 会場の騒音状態(70dB)でも正確に認識できることを確認。

Timeline

Software Engineer

Micro-Star International
11.2019 - Current

Testing Engineer

安富科技股份有限公司
10.2015 - 10.2016

Master of Science - Physics

国立台湾師範大学
04.2001 -

Bachelor of Science - Physics

輔仁大学
04.2001 -
WEN PING ZHU