(Akhil Lohia,印度卡纳塔克邦班加罗尔的开发商
Akhil is available for hire
Hire Akhil

(Akhil Lohia

验证专家  in 工程

机器学习开发人员

Location
印度卡纳塔克邦的班加罗尔
至今成员总数
2018年11月23日

Akhil是一名数据科学家和经济学家,在学术界和企业项目中都有Experience. 他使用Spark和Python以及census为端到端机器学习管道建模了大量客户点击流数据, 问卷调查, 和随机对照试验数据. 他沟通非常好,并与跨时区的团队合作过. Akhil还擅长快速掌握新技能.

Portfolio

eka.care
Python,亚马逊网络服务,深度学习,机器学习...
MYRM科技有限责任公司
Pandas, Salesforce, 匹配系统, Jupyter笔记本, 亚马逊雅典娜...
MakeMyTrip
亚马逊SageMaker, PyTorch, 亚马逊网络服务(AWS), PySpark, 数据科学...

Experience

Availability

Full-time

首选的环境

Python, Git, PyCharm, Jupyter, Unix

最神奇的...

...我参与的项目是印度最大的在线旅行社的客户支持聊天机器人.

工作Experience

高级数据科学家

2020 - 2021
eka.care
  • 开发从处方等医疗文件中提取相关信息的模块, 病理实验室报告, 以及疫苗接种证书,并使其数字化并可搜索.
  • 利用LayoutLM模型对医学文献中的关键词进行定位和提取.
  • 开发了从上传文档到实体提取的端到端管道, 包括在AWS生态系统上的文档分类和手动数据注释步骤.
  • 合作使用SNOMED CT设计针对不同医疗状况和症状的医学相关层次, 这有助于医生在处方簿上提供情境选择.
技术:Python,亚马逊网络服务,深度学习,机器学习, 数据科学, Amazon S3 (AWS S3), 亚马逊雅典娜, Jupyter笔记本, 数据分析, 需求分析

数据科学家

2020 - 2020
MYRM科技有限责任公司
  • 从杂乱无章的电子表格集合中插入重复数据删除和交叉引用的客户记录到Salesforce系统中.
  • 设计了一个数据库,用于将Salesforce数据迁移到基于RoR的系统.
  • 从各种来源导入到Salesforce系统中,以便有效地跟踪潜在客户并进展到交易完成的不同阶段.
技术:Pandas, Salesforce, 匹配系统, Jupyter笔记本, 亚马逊雅典娜, 数据分析

首席数据科学家

2017 - 2020
MakeMyTrip
  • 开发了一个酒店排名模型,使用用户最近的互动来显示相关的结果.
  • 基于客户在电子商务渠道中的活动构建了一个用户意图预测模型.
  • 构建聊天机器人的NLP部分,用于处理业务的售后需求.
  • 合作设计了一个功能市场——一种数据仓库,它将来自多个来源的数据组合在一起,供数据科学模型使用.
  • 创建了旅游领域的通用搜索,允许用户使用自由文本搜索酒店和航班. 这涉及到应用自然语言处理技术从文本中提取相关字段.
技术:亚马逊SageMaker, PyTorch, 亚马逊网络服务(AWS), PySpark, 数据科学, NumPy, Pandas, Apache气流, Redshift, Spark, 自然语言处理(NLP), GPT, 生成预训练变压器(GPT), 机器学习, Python, 人工智能(AI), 算法, 数据分析, Amazon S3 (AWS S3), NoSQL, 亚马逊雅典娜, Jupyter笔记本

数据科学家|分析师

2019 - 2019
Mix Tech(通过Toptal)
  • 在Redshift和Metabase上设置各种仪表板,以了解产品在不同客户群和设备中的表现.
  • 分析客户数据并监控用户留存等统计数据, 应用安装/卸载率, 用户参与, 每日/每周/每月/季度表现, 以及客户在漏斗中的移动, etc.
  • 使用PySpark和Python开发了一个客户流失模型,根据客户流失的概率来定位客户.
技术:亚马逊网络服务(AWS), 数据分析, Spark, 机器学习, Metabase, SQL, Redshift, Python, 数据分析, 数据建模, Amazon S3 (AWS S3), 亚马逊雅典娜, Jupyter笔记本

研究助理

2015 - 2017
庞培法布拉大学
  • 在印度通过婚姻市场开发了一个将家庭财富与杀女婴联系起来的模型.
  • 估计结构模型并进行反事实政策模拟,为干预提供信息. 使用亚马逊网络服务(AWS)实现繁重的计算任务.
  • 通过平衡方程的推导和证明的检验,建立了模型的理论解. 在Matlab中对模型经济进行了仿真.
技术:Mathematica, MATLAB, Python,经济学,数据建模

数据科学特色市场

我在AWS Redshift中开发了一个功能存储,它可以整理来自许多不同来源的数据,并以所需的格式提供这些数据. 它使数据变得干净, 总是最新的, 并准备好用于生产中的机器学习模型.

数据标注工具

我改进了Django中的一个开源数据标记工具,为聊天机器人中使用的NLP分类器创建训练数据. 它支持标记每个实例的动态选项.

Ranking

我开发了一个机器学习模型,根据用户与产品的历史和最近的交互以及与其他用户的相似性,向用户显示个性化排名.

南印度社区研究

我在南印度从事社会网络经济学的研究项目,涉及一项随机对照试验.
我开发并定制了一个名字匹配算法,将即将到来的病人与项目的人口普查数据进行匹配.

预测他们所有人

我开发了一个基于r - shine的机器学习应用程序,它可以预测你在《欧博体育app下载》手机游戏中的特定地点和时间会遇到哪种Pokemon生物. 机器学习模型是在一个大型的公开游戏数据集上进行训练的.

实时多人游戏

我开发了一款整合了微软Kinect和Windows Phone的即时多人游戏,允许一名使用手机的玩家为使用Kinect的玩家制造障碍.

聊天机器人意图分类器

我为聊天机器人MakeMyTrip做了一个基于深度学习的意图分类模型, 印度最大的在线旅行社. 这个意图分类器基于ULMFiT模型. 它能够在100多个类中对意图进行分类.

槽提取和意图分类

我开发了一个基于序列到序列(Seq2Seq)架构的联合模型,该模型允许用户从给定给聊天机器人的话语中提取意图和槽值.

医疗文件理解

一个基于python的应用程序,用于分类和解析医学文档(包括实验室报告), 处方, 疫苗接种证书, etc.).

这使得这些文件可以以数字方式获取和搜索. 这与Google Photos对杂乱无章的照片所做的非常相似. 它使你所有的医疗文件组织在适当的类别和容易搜索与相关的医疗术语, 即使是手写的.

语言

Python, SQL, R, C, Java, Scala

框架

Spark, Django, Seq2seq

库/ api

Pandas, PySpark, NumPy, SpaCy, PyTorch, TensorFlow

Tools

Git, Jupyter, Redash, Apache气流, Amazon Elastic MapReduce (EMR), 亚马逊SageMaker, 亚马逊雅典娜, 亚马逊QuickSight, MATLAB, STATA, LaTeX, PyCharm, Mathematica

范例

数据科学,需求分析

Platforms

Linux、MacOS、亚马逊网络服务(AWS)、Jupyter笔记本、Docker、Unix、Salesforce

Storage

MySQL, Redshift, Apache Hive, Amazon S3 (AWS S3), Data Pipelines, Elasticsearch, NoSQL

Other

深度学习, 统计数据, 预测学习, 预测建模, 数据可视化, 工程数据, 分析, Big Data, Economics, 机器学习, 自然语言处理(NLP), 数据分析, 人工智能(AI), 算法, 数据分析, 机器学习操作(MLOps), GPT, 生成预训练变压器(GPT), 数据匹配, 统计建模, 库存管理系统, 推荐系统, 数据建模, Metabase, 自定义音频嵌入, 计算机视觉, 匹配系统

2016 - 2017

数据科学硕士学位

巴塞罗那经济研究生院-巴塞罗那,西班牙

2011 - 2015

经济学学士学位

印度理工学院坎普尔-坎普尔,印度

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

分享你的需求

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

选择你的才能

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

开始招聘