• Hi!
    I'm Jonathan

    あらゆることに興味を持ち、新しいことに挑戦する情熱があります。

    履歴書をダウンロード

  • I'm
    an
    AI Engineer

    専攻は電気工学で、研究分野はコンピュータビジョンです。

    Github を見る

  • Work
    Hard,
    Play
    Harder!

    私の趣味:

    ピアノとギター

    トランプマジック

    ハイキングと登山

    AI とコンピュータビジョン

    読書と執筆

    スケートボード

    星空観察

    写真撮影

    なんでもあり

🧑‍💻自己紹介

こんにちは!私は范植貿(Chi-Mao Fan)ですが、「ジョナサン」と呼んでいただいても大丈夫です。国立中興大学(NCHU)で修士号を取得し、専攻はコンピュータビジョン(CV)と人工知能(AI)でした。

現在、台湾のASUSにあるデジタルイメージ技術部門でR&Dエンジニアとして勤務しています。AI技術の進歩に強い関心があり、常に新しくて面白いプロジェクトに挑戦することに情熱を持っています。

これまでの経験やスキルについてさらに知りたい方は、以下の情報をご覧ください。


💼職務経歴

ASUS AI研究開発ソフトウェアエンジニア 2022年〜現在

ASUSのデジタルイメージテクノロジー(DIT)部門にて、AIを活用したコンピュータビジョンアルゴリズムの開発と実装を担当し、フロントエンドとバックエンドのチームと協力しながら、顧客向けに革新的なソリューションを提供しています。技術力、コミュニケーション能力、プロジェクト管理スキルを活かし、プロジェクトを成功に導き、効果的な解決策を実現しています。

#Python #CSharp #C++ #OpenCV #PyTorch #Tensorflow #Gitlab

工業技術研究院(ITRI) Androidシステム開発インターン 2021年〜2022年

大学院2年目に、台湾の工業技術研究院 情報通信研究所から面接の招待を受け、Androidシステム開発チームの支援を担当しました。Androidのイメージファイルを開発ボードに書き込む手法を学び、実践する中で、Android OSのアーキテクチャやアプリインストールの仕組みについての理解を深めました。

#C #Android開発 #組み込みシステム

🏆コンテスト実績

車両追跡(2024)

超低フレームレートの CCTV 映像に対応するために、独自に設計した物体追跡手法を開発。全国大会で第2位(社会人部門で第1位)を獲得しました。

Github

シャトル追跡(2023)

AI 技術を用いて、バドミントンの試合におけるシャトルの位置と軌道を解析します。

Github

音声譜面変換(2022)

音源分離と音声転写を統合した AI アプリケーションを開発し、音楽入力を楽譜に変換。Intel DevCUP にて第3位を受賞。

Github

蘭の分類(2022)

7種類の分類モデルをさまざまなアンサンブル手法で統合し、蘭の品種を予測。全国743チーム中、第18位を獲得しました。

Github

データ回帰(2021)

マルチレイヤーパーセプトロンを用いて工業データを予測し、現場で新たに提供された訓練データに基づきリアルタイムでモデルを再学習。118チームの中から決勝に進出。

Github

稲作検出(2021)

空中写真から稲を検出するために、YOLOv4 の物体検出モデルを使用。最終成績は上位10位に入り(523チーム中 第9位)。

Github

📑論文・発表

実画像復元のための複合マルチブランチ特徴融合
画像復元は困難かつ不適切な問題であり、長年にわたる課題とされています。しかし、多くの学習ベースの復元手法は特定の劣化タイプにのみ対応しており、汎用性に欠けます。本研究では、人間の視覚系(特に網膜神経節細胞)から着想を得たマルチブランチ復元モデルを提案し、汎用的なフレームワーク内で複数の復元タスクを実現します。提案する多枝構造「CMFNet」は、画像のブレ除去、霧除去、雨滴除去など、自動運転車における一般的な応用に対して、4つのデータセットで優れた性能を示しました。

選択可能な残差ブロックを用いた改良型階層エンコーダ-デコーダネットワークによる画像復元
本研究では、軽量な階層型ネットワーク構造 U-Net をベースに、画像復元で有効ながらもメモリ消費の多い RDB(Residual Dense Block)を より効率的な Selective Residual Block(SRB)へ改良しました。また、U-Net に「ゲートポスト特徴パス(gatepost feature paths)」を追加することで、 従来の U-Net と比べて空間的特徴をより豊かに表現でき、SRB との相乗効果も得られました。 さらに、画像復元における重要指標である PSNR および構造類似度(SSIM)に基づく損失関数を提案し、モデルの最適化を行いました。 最終的に、本ネットワークはノイズ除去、ブレ補正、雨滴除去、霧除去、低照度画像強調などを含む 9種類の復元タスクに対応可能であり、定量評価および視覚品質の両面で優れた性能を示しました。 本論文は IEEE 2022 Taipei Section 最優秀修士・博士論文賞に選出されました 🎉

M-Net+ における半ウェーブレットアテンションによる低照度画像の強調
低照度画像強調は、暗い画像を適切な明るさに改善するコンピュータビジョンのタスクであり、画像復元における不適定問題とも見なされます。 深層学習の発展により、畳み込みニューラルネットワーク(CNN)は従来のアルゴリズム手法を凌駕し、コンピュータビジョン分野の主流となりました。 本研究では、改良された階層型モデル M-Net+ に基づく画像強調ネットワーク HWMNet を提案します。 M-Net+ に半ウェーブレットアテンションブロックを導入することで、小波領域の特徴をより豊かに表現します。 2つの低照度画像強調データセットにおいて、提案手法 HWMNet は定量評価と視覚的品質の両面で優れた性能を示しました。

ブラインド画像ノイズ除去のための改良型階層構造 M-Net+
画像のノイズ除去は、長年にわたる ill-posed な課題です。近年では、畳み込みニューラルネットワーク(CNN)が注目を集め、コンピュータビジョン分野を席巻し、様々な視覚タスクで顕著な成果を上げています。その中でも有名な階層型 CNN の一つが U-Net であり、ノイズ除去を含む多くのタスクにおいて優れた性能を発揮しています。しかし、こうした階層構造は繰り返されるダウンサンプリングにより空間情報の損失を引き起こし、特にノイズ除去のようなピクセル単位の処理に深刻な影響を及ぼします。本研究では、空間情報損失の改善を目的に、画像ノイズ除去に適した改良型の階層構造 M-Net+ を提案します。2つの合成ガウスノイズデータセットでテストを行い、競争力のある結果が得られました。

実画像のノイズ除去のための選択的残差 M-Net
画像復元は、劣化した画像をノイズのない状態に回復するための低レベル視覚タスクです。ディープニューラルネットワークの成功により、畳み込みニューラルネットワーク(CNN)は従来の復元手法を凌駕し、コンピュータビジョン分野の主流となっています。本研究では、U-Net を改良した階層型ブラインド画像ノイズ除去ネットワーク(SRMNet)を提案します。具体的には、M-Net に残差ブロック付きの選択的カーネルを導入することで、多スケールのセマンティック情報を強化します。提案する SRMNet は、2つの合成データセットと2つの実画像ノイズデータセットにおいて、定量指標と視覚的品質の両面で優れた性能を示しました。ソースコードと事前学習済みモデルは以下より入手可能です:https://github.com/FanChiMao/SRMNet

SUNet:Swin Transformer を用いた UNet による画像ノイズ除去
画像復元は、長年にわたり取り組まれてきた困難な ill-posed 問題です。近年では、畳み込みニューラルネットワーク(CNN)がコンピュータビジョン分野をほぼ独占し、画像復元を含む様々なタスクで顕著な成果を上げてきました。しかし、最近では Swin Transformer ベースのモデルが優れた性能を示し、高レベルな視覚タスクにおいては CNN を超える最新のアプローチとなっています。本研究では、Swin Transformer レイヤを基本ブロックとして採用し、それを UNet アーキテクチャに組み込んだ復元モデル「SUNet」を提案します。本モデルは画像ノイズ除去に応用されます。

WBTP-VTON:全身およびテクスチャ保持に基づくバーチャル試着ネットワーク
画像ベースのバーチャル試着システムは近年ますます注目されていますが、まだ多くの課題が残されています。そこで本研究では、全身およびテクスチャの保持を考慮した新しい完全学習型モデル「WBTP-VTON(Whole Body and Texture Preservation based Virtual Try-On Network)」を提案し、この分野における課題解決を目指します。まず、WBTP-VTON テンプレート変換では、幾何学的マッチングモジュール(GMM)を用いて、ターゲット人物の体型に合わせて衣服やズボン(またはスカート)を変形させます。次に、最終的な画像を合成し、生成結果のリアリティを高めます。最後に、試着モジュールと合成マスクを用いて、変形された衣服と最終画像を統合し、滑らかな描写を実現します。大規模なデータセットによる実験の結果、提案する WBTP-VTON はバーチャル試着において優れた性能を示しました。


🏫学業経歴

電気工学の修士号を取得し、深層学習と人工知能によるコンピュータビジョンを専門とし、研究の中心は画像復元です。GPA 4.13/4.15 という優れた成績で卒業し、データ分析、物体検出、セグメンテーションなど複数の深層学習コンペに参加しました。4 本の国際会議論文を執筆し、ICIP、EUSIPCO、ISCAS などの主要国際会議で採択され、修士論文として2022 IEEE Taipei Section Best Paper Awards を受賞しました。実世界の課題に対して、ソフトウェア技術で革新的なソリューションを生み出すことに情熱を持っています。

元智大学の電気工学科を卒業。主に電子回路、電磁気学を学びながら、データ構造や C 言語などの基礎的なプログラミングも修得しました。卒業研究では、Android スマートフォン向けアプリの開発に取り組み、JavaScript、SQL、ソケット通信などの技術を使用しました。このプロジェクトを通して、ハードウェアよりもソフトウェア開発に対する興味と適性があることに気付きました。

💻プログラミングスキル

C/C++

80%

C#

70%

Python

90%

JavaScript

60%

Html

50%

CSS

50%

🖼️フォトギャラリー

思い出の瞬間を集めたフォトコレクションをご覧ください。下の画像またはリンクをクリックすると、フォトギャラリーに移動します。