About me

姓名 :豆家敏                                          微信 :1264310280                                        
性别 :男 邮箱 : unasm@sina.cn
专业 :信息对抗技术 github :https://github.com/unasm
出生年月 :1992年2月 毕业时间 :2014年7月
毕业院校 :电子科技大学/UESTC 本科        供职公司 :新浪,借贷宝,思必驰      
技术栈
  • 开发经验丰富,编程能力强悍,解决问题能力强悍,负责过业务系统,基础架构,数据仓库的系统设计,架构,开发
  • 熟悉Java,python开发,了解微服务,服务治理,Spring Boot. 使用过go,lua,PHP,nodejs等,了解监控,常见的性能优化,自动化测试等
  • 对机器学习感兴趣,熟悉常见的机器学习技术,如xgboost,cnn,svd,协同过滤等,阅读过gbdt源码,结巴分词源码等,对知识图谱有一定的了解
  • 有一定的大数据经验,对kafka, es, impala,kylin等有一定了解,负责部门数据统计,可视化,报表,用户请求分析,全链路流量复盘等大数据相关工作
  • 阅读过redis(3.0,C语言)源码, 阅读过beego部分源码
  • leetcode AC 100+, 西南地区ACM二等奖,Kaggle 房价预测 550+名, 羽毛球第四级
2018.1 ~ 至今 思必驰开发工程师,数据工程师,绩效优秀
  1. 日志系统设计搭建,日志中间件开发,完成了格式化业务日志,追踪请求的调用关系,响应时间,处理过程,延迟,异常等等,支持数据埋点,自动化记录等功能,结合elk,kafka,filebeat等搭建了日志体系,满足研发实时追查线上问题的需求,成为监控报警,以及数据分析重要部分,推进了日志规范落地执行,奠定了数据的基础,部门最成功最核心的基础服务
  2. 数据仓库的设计和搭建,建立了数据从收集到输出的体系。 统一日志规范,搭建设计了日志的收集清洗系统,提取对话内容,数据偏差在1%以内,统计线上响应情况,pv,uv,通过kylin 提供 http接口,支撑内容查询,数据报表和分析需求。
  3. 对话管理系统开发改进,对话系统的改进,增加多轮对话,整理闲聊数据,推进了单元测试和交互测试的落地,极大提升了服务质量,避免问题反复
  4. 优化DM性能延迟,响应时间压缩到90分位在200ms以内
  5. 维护了敏感词识别,反问句生成,意图识别等项目
  6. 优化儿童闲聊,高水平问答对从最初的20+%命中率提升到46%, 召回率达到90+%,达到业内领先水平,确立了技能的优化体系
2015.9 ~ 2017.12 借贷宝数据服务,研发工程师,算法工程师
  1. 参与了公司的征信建模,通过使用xgboost,tensorflow对用户信用评级。使用tableau提供BI服务,通过spark集群做一些查询工作,数据分析处理工作。做过一些NLP的工作。
  2. 主导了数据服务本地化工作,搭建从客户端埋点,到数据检查清洗,kafka传输,parquet存储,impala查询,日消费数据千万级,推进了数据服务可视化的工作。
  3. 维护开发了红包系统,抽样系统等,抽样系统为lua + C 开发,扩展ng rewrite阶段功能,达到流量采样分化的目标,通过连接池,共享缓存,init阶段初始化等方式,控制系统响应时间控制在0.1ms内。
  4. 企业版研发leader,维护开发企业版,地推,红包等系统,参与整个系统的设计和讨论,包括企业门户,支付,鉴权,好友,passport等系统的角色界定和分工,系统间通信等,负责了企业门户的开发,错误追查,数据修复,Code Review, 新功能评审,排期,协调研发资源,测试资源,推进需求完成等等。
2014.7 ~ 2015.9 新浪 PHP开发工程师
  1. 维护新浪论坛,新浪体育,新浪