持续学习 领导力 坦诚清晰
金融计量经济学 统计学 机器学习
SQL MongoDB Hive MaxCompute
Python R Linux
- 工作经历
-
KiwiDrop
[1]
广州/远程
数据工程师 | 数据分析师
2023-01 ~ 2023-12
- 优化业务依赖的数据表格看板;建立简易 ETL 流程和数据仓库;规范指标定义;配置 Looker 系统。
- 定价策略分析、库存数据分析、竞对分析、和财务损益分析。
斯达领科
[2]
深圳
数据中心部门负责人 | 数据分析师
2020-08 ~ 2022-02
- 建设公司基础数据能力。从零建设大数据仓库、BI 数据后台;接入和维护原始数据;沉淀业务知识库文档;梳理指标体系;前端埋点方案设计等等。
- 对接业务方数据应用和分析需求。组织团队进行日常和专题数据分析,例如用户行为画像、库存分析、商品聚类和趋势分析;参与和设计数据应用项目,例如商品排序和推荐、用户召回、财务稽核对账自动化、情报系统。
- 负责部门管理工作。OKR 目标制定和复盘;组织每周培训和业务分享、每月一对一沟通,培养团队文化;强调流程和文档沉淀。
帕拓逊
[3]
深圳
独立站业务负责人
2019-07 ~ 2020-07
- 推进业务数据和系统化;通过数据挖掘开发新品;项目月销售额半年增长 7 倍。
- 部门独立为创业公司,作为创始人之一参与所有业务流程,达成目标并获得追加投资;后被斯达领科收购。
数据分析师
2019-03 ~ 2020-04
- 业务系统功能优化和工具开发,例如 Facebook 广告 ROAS 预测模型、亚马逊竞品趋势跟踪、广告词整合工具、财务对账工具。
有利网
[4]
北京
信贷风控负责人
2016-10 ~ 2018-04
-
设计、开发和迭代风控模型,设计系统方案;实现了基于 GBDT 评分卡模型的自动信用审核,坏帐率达到行业最低水平;设计和开发异常监控。
-
管理风控团队 10 多人和特征工程项目;每周进行组会、技术分享。
数据分析师(运营与营销)
2016-05 ~ 2018-04
-
用户分类模型(GBDT)、平台整体投资和赎回时间序列模型、营销活动 A/B 测试统计检验、推广渠道转化率监控系统和作弊数据异常甄别。
中国平安人寿保险股份有限公司
沈阳,辽宁
辽宁区域拓展部,实习
2015-10 ~ 2015-11
- 教育背景
-
北卡罗莱纳大学教堂山分校
教堂山,美国
金融计量经济学,硕士(博士未完成)[5]
2007 - 2014
-
研究方向:金融计量经济学、资产定价、高频价格波动率的测量。
-
助教:高级计量经济学,时间序列,中级宏观经济学,经济学原理。
北京大学
北京
元培计划(学院),经济学学士
2003 - 2007
- 项目
-
简易 ETL 和数据仓库
KiwiDrop
- 用 Python 实现的 ETL 流程以及基于 SQLite 的小型“数据仓库”。
- 解决了业务数据分散难聚合的痛点,改善了数据时效性和一致性,并为下一步的大数据仓库打下了基础。
数据仓库
斯达领科
- 使用阿里云 DataWorks 和 MaxCompute 产品建设数据仓库,整合跨境电商各主题数据,大幅降低开发成本和提升数据使用效率。
- 基于数仓开发 BI 系统、用户标签系统、财务对账、商品推荐和排序等数据应用。
情报系统
斯达领科
- 收集电商平台、品牌网站、和社交媒体公开数据,跟踪市场最新动态,提高商品开发效率和成功率。
- 通过图片聚类算法和图片标签模型,从市场商品中抽象出热点元素、颜色和品类。
风控审核授信系统
有利网
-
设计风控系统流程,与研发确认实现方案;管理风控规则,维护开发文档,参与开发和维护部分线上风控规则模块。
-
训练 logistic 以及 GBDT 模型评分卡,部署到线上风控系统,按用户类型使用不同的评分模型,模型的迭代速度从一个月一次到每周一次。
-
实现全自动信用审批,风控系统效果稳定提升,坏帐率达到行业内最低水平。
R 程序包
有利网
-
开发维护团队 R 程序包,简化和标准化团队的工作流程。封装 SQL、MongoDB 等多种数据库和数据接口的交互、常用数据清理和指标计算函数。
道琼斯成份股的高频数据
UNC
- 提取和清理道琼斯指数成份股 1992~2013 年的高频市场数据(TAQ 数据库,约 400 亿条记录)。
- 探测清理离群值,创建不同取样频率的价格时间序列,计算成份股和指数的每日波动性非参数统计量;利用高频数据改善波动性预测模型。
- 技能
-
计算编程
Python,R,Matlab,Shell,C/C++
SQL,MongoDB, Hive, MaxCompute
语言
中文(母语),英语(精通)