Gavatar

潘昊

数据画家,闲云匠人,全栈程序员,智能实践者……

北京

工作经验

  • 2013

    爱奇艺

    技术产品中心
    后台开发部

    架构师、研究员、技术委员会委员

    (2013 - 至今) | 北京

    统一发布平台

    统一各个终端的发布流程以及模板制作的接口,统一数据接口服务发现。

    会员系统架构升级

    在会员业务出现瓶颈后,优化会员系统架构。数据库分表分库、降低事物粒度优化性能。通过分拆服务接口,通过微服务的方式提高业务灵活性。增强系统及业务层面的监控及报警。

    智能运营系统

    通过机器学习进行视频自动化分类、生成推荐标签、用户推荐、标签聚合。简化编辑工作流程,提高生成效率。对客服系统的自动应答;文学系统的搜索、排重、评分;社交系统的自动对话等提供支持。

    页面发布系统

    后台动态动态生成,页面内容需要调用多个内部接口,通过多线程并发调用提高性能。

  • 2005

    IBM

    China Development Lab (CDL)
    Information Management

    软件工程师

    (2005 - 2013) | 北京

    IBM Data Studio

    一个基于eclipse的集成化数据库管理解决方案。

    IBM Smart Analytics System

    IBM的数据挖掘的整体解决方案

    IBM PureApplication System

    IBM一款专门针对事务型web和数据库应用程序而设计的平台系统,Bluemix前身。

    Optim Query Tuner

    一款数据库查询优化工具。

    Optim Performance Manager

    通过Web界面来隔离并分析典型的数据库性能问题。查看数据库运行状况的摘要。

教育经历

  • 2004

    北京大学

    硕士 , 软件与微电子学院 , 软件工程

    (2004 - 2007)

  • 1999

    华中科技大学

    学士 , 电气与电子工程学院 , 电气工程及其自动化

    (1999 - 2003)

编程语言

  • Java
    80%
    最早接触的实际开发语言。熟悉JVM内存模型、GC策略等,阅读过虚拟机规范。能非常熟练的使用并了解运行机制。对多线程和I/O部分做过深入研究。Jave EE 和 Spring、Hibernate等框架有丰富的使用经验并阅读过部分源代码。
  • JavaScript
    80%
    也是较早接触的开发语言。偏向对原生JavaScript的了解,能熟练使用常用的原生JavaScript API,了解过浏览器运行机制。对流行框架停留在使用层面,少部分框架或者库阅读过代码。也有过后端Node.JS的使用经验。
  • HTML, CSS
    70%
    配合前端数据可视化,了解常见HTML标签语义,CSS选择器、定位、盒模型、动画、位移等。
  • GPGPU - CUDA, OpenCL
    90%
    熟悉GPU编程模型,常用接口以及优化策略。OpenCL比CUDA略熟悉。发表过四篇相关专利。
  • C/C++
    60%
    配合GPU编程使用,作为CUDA和OpenCL宿主语言,没有太深入。熟悉Linux下gcc的使用和编译过程,能写简单的makefile和CMake。也有过使用OpenCV和ffmpeg的经验。
  • Python
    80%
    主要用来写系统配置脚本和作为数据分析工具,常见API能熟练使用,细节还需要借助文档。
  • Scala
    50%
    主要配合Spark使用,了解语法、常见API,和函数式编程模型。

开发知识

  • 数据可视化
    90%
    长期从事相关工作。拥有管理学背景,能根据商业模型分析数据模型并决定展示重点。能以需求为基本出发点,依靠自己的技术栈,从头至尾实现数据可视化。发表过两篇相关专利。
  • 机器学习
    80%
    熟悉常见机器学习算法,写代码实现过朴素贝叶斯、线性回归、随机森林、kNN等算法,能使用协同过滤、关联规则、SVM等算法。能根据已有数学模型做代码实现和优化。能较熟练的使用Theano、Mahout、Spark ML。小规模使用过Caffe,正在学习TensorFlow,了解深度学习常见模型和优化算法。发表过两篇相关专利。
  • 并行并发
    80%
    源于Java多线程,运用于GPU高性能计算。了解锁机制、函数式编程、Actor、GPU SIMD等并发、并行编程模型。发表过一篇相关专利。
  • Hadoop
    70%
    理解HDFS、编写MapReduce。配置Hadoop环境并调优参数,阅读过部分代码。实现过TeraSort。有使用HBase、Hive、Pig、Flume、Sqoop等的经验。
  • Spark
    70%
    理解RDD。配置Spark环境,阅读过部分代码。实现过TeraSort。常用MLlib模块,使用过Streaming模块。
  • Mesos
    40%
    安装配置,结合Spark使用。阅读过allocator部分代码。
  • OpenStack
    60%
    有小规模安装配置经验,做过Horizon的二次开发,阅读过部分代码。
  • Docker
    70%
    有安装Kubernetes经验,目前开发环境全部基于Vagrant或Docker。熟练编写Dockerfile。
  • 数据库
    70%
    在IBM长期从事数据库相关工具的开发。MySQL、PostgreSQL、MongoDB等配置及简单调优。熟悉数据库建模,能掌握中等难度的SQL语句。

Patents

语言

  • 母语中文
  • ProfessionalEnglish