华硕 AI 研发软件工程师 2022 - 至今
在华硕数字图像技术部门(DIT)担任研发工程师期间,我负责开发与实现基于 AI 的计算机视觉算法,并与前端和后端团队协作,为客户打造创新解决方案。凭借我的技术能力、沟通技巧与项目管理经验,我成功交付多个项目,并提供高效的技术支持。
#Python #CSharp #C++ #OpenCV #PyTorch #Tensorflow #Gitlab你好!我叫范植贸,你也可以叫我 Jonathan。我在国立中兴大学(NCHU)获得硕士学位,主修计算机视觉(CV)和人工智能(AI)。
目前,我在台湾华硕(ASUS)担任数字图像技术部门的研发工程师。我对 AI 技术的前沿发展充满热情,并且热衷于参与新的、有趣的项目。
如果你想进一步了解我的经历和技能,欢迎浏览下方内容。
在华硕数字图像技术部门(DIT)担任研发工程师期间,我负责开发与实现基于 AI 的计算机视觉算法,并与前端和后端团队协作,为客户打造创新解决方案。凭借我的技术能力、沟通技巧与项目管理经验,我成功交付多个项目,并提供高效的技术支持。
#Python #CSharp #C++ #OpenCV #PyTorch #Tensorflow #Gitlab硕士二年级期间,我收到了来自工业技术研究院信息与通信研究所的面试邀请,进入 Android 系统开发团队实习。我学习并实操了将 Android 镜像文件刷写至开发板的技巧,加深了对 Android 操作系统架构及应用安装流程的理解。
#C #Android 开发 #嵌入式系统 复合多分支特征融合用于真实图像修复
图像修复是一个具有挑战性的 ill-posed 问题,也是长期以来的研究难题。然而,大多数基于学习的修复方法仅针对单一退化类型,缺乏泛化能力。本文提出了一种受人类视觉系统(例如视网膜神经节细胞)启发的多分支图像修复模型,可在统一框架下完成多种修复任务。实验结果显示,所提出的多分支架构 CMFNet 在四个数据集上均表现优异,涵盖图像去模糊、去雾和去雨滴等自驾车常见应用场景。
利用可选择性残差块在改良的分层编解码网络中实现图像修复
本研究基于轻量级的 U-Net 分层网络架构,并将擅长图像修复但内存占用较高的 RDB(Residual Dense Block)改进为更高效的
可选择残差模块(SRB)。我们还在 U-Net 中引入 gatepost 特征通道,与传统 U-Net 相比,可以丰富空间特征信息,
并与 SRB 产生协同效应。此外,我们提出一种新的损失函数,结合图像修复中的两个关键指标:PSNR 与结构相似度(SSIM),
以优化模型。最终,所提出的网络可处理 9 种不同的图像修复任务,如去噪、去模糊、去雨滴、去雾和低光图像增强等,
在定量评估指标与视觉质量方面均表现出色。
本论文获选为 IEEE 2022 台北分会最佳硕博士论文奖 🎉
基于 M-Net+ 的半小波注意力机制用于低光图像增强
低光图像增强是一项用于将昏暗图像增强至合适亮度的计算机视觉任务,也被视为图像复原领域中的病态问题之一。
随着深度神经网络的发展,卷积神经网络已超越传统基于算法的方法,成为计算机视觉的主流。
为了进一步提升增强算法的性能,我们提出了一种基于改进型 M-Net+ 的图像增强网络 HWMNet。
该方法在 M-Net+ 上加入半小波注意力模块,用于丰富小波域的特征信息。
在两个低光图像增强数据集上的实验结果显示,HWMNet 在定量指标和视觉质量上均表现优异。
改进的层次结构 M-Net+ 用于盲图像去噪
图像去噪是一个长期存在的 ill-posed 问题。近年来,卷积神经网络(CNN)成为研究焦点,在计算机视觉领域中占据主导地位,并在多个视觉任务中取得了显著成果。U-Net 是一个知名的层次型 CNN 主干,在去噪与其他任务中表现出色。但层次结构在反复下采样过程中往往会导致空间信息丢失,这对以像素为基础的任务(如去噪)造成严重影响。本文提出了一个改进的层次主干 M-Net+,以缓解上述問題,并在两个合成高斯噪声数据集上进行了测试,展示了良好的性能表现。
选择性残差 M-Net 用于真实图像去噪
图像修复是一项低层次的视觉任务,目标是将退化的图像还原为无噪声的图像。随着深度神经网络的广泛应用,卷积神经网络已超越传统修复方法,成为计算机视觉领域的主流。为提升去噪算法性能,我们提出了一种基于层次结构的盲真实图像去噪网络(SRMNet),该架构源自 U-Net 的改进版。具体来说,我们在 M-Net 框架中引入了结合残差模块的选择性卷积核,以增强多尺度语义信息。我们的方法在两个合成与两个真实世界的噪声数据集上,在定量评估与视觉质量方面均表现出色。源代码和预训练模型可通过以下链接获取:https://github.com/FanChiMao/SRMNet。
SUNet:基于 Swin Transformer 的 UNet 图像去噪方法
图像修复是一个具有挑战性的 ill-posed 问题,也是长期存在的难题。在过去几年里,卷积神经网络(CNN)几乎主导了整个计算机视觉领域,并在包括图像修复在内的各类视觉任务中取得了显著成功。然而,近期基于 Swin Transformer 的模型也展现出令人惊艳的性能,甚至在高阶视觉任务上超越了 CNN 方法,成为最新的主流。在本文中,我们提出了一个名为 SUNet 的图像修复模型,使用 Swin Transformer 层作为基础模块,并将其应用于 UNet 架构以完成图像去噪任务。
WBTP-VTON:基于全身和纹理保持的虚拟试衣网络
基于图像的虚拟试衣系统日益受到关注,但仍面临许多未解决的挑战。因此,我们提出一种全新且可端到端学习的方法——WBTP-VTON(Whole Body and Texture Preservation based Virtual Try-On Network),以解决该领域中的实际问题。首先,WBTP-VTON 使用几何匹配模块(GMM)进行模板转换,根据目标人物的身形对目标上衣和裤子(或裙子)进行调整。第二阶段是合成最终图像,使生成结果更为逼真自然。最后,我们结合试穿模块与合成掩码,将变形后的服装与最终图像融合,确保图像的平滑与一致性。在大规模数据集上的实验证明,WBTP-VTON 在虚拟试衣任务上具有先进的性能。
电气工程硕士学位,专注于通过深度学习与人工智能实现计算机视觉任务,研究方向为图像修复。以优秀的 GPA 4.13/4.15 毕业,并参与多个深度学习竞赛,内容涵盖数据分析、目标检测与图像分割。共发表 4 篇国际会议论文,分别被 ICIP、EUSIPCO 和 ISCAS 等国际会议接受,并获得 2022 IEEE 台北分会最佳论文奖。热衷于运用软件能力开发创新解决方案,应对现实挑战。
本科毕业于元智大学电气工程系,主修电子学、电路与电磁学,并学习了数据结构、C 语言等基础编程课程。毕业设计为 Android 手机应用开发,使用了 JavaScript、SQL 和 socket 通信等技术。通过这个项目,我发现相比于偏向硬件的技术,我更喜欢软件开发领域。