Rudolf Eremyan, Developer in Tbilisi, Georgia
Rudolf is available for hire
Hire Rudolf

Rudolf Eremyan

Verified Expert  in Engineering

Data Science Developer

Location
Tbilisi, Georgia
Toptal Member Since
August 2, 2018

鲁道夫是一名数据科学家,在该领域有8年的经验. 他为格鲁吉亚语言开发了第一个聊天机器人框架, which the largest bank in Georgia adopted. Rudolf为财富500强公司设计了基于云技术的大数据处理管道和分析解决方案. 他被邀请担任国际黑客马拉松和会议(如PyData)的演讲者和评委, Google DevFest, and NASA's international space app challenge.

Portfolio

Amgreat North America
Python,数据科学,Plotly,数据工程,亚马逊网络服务(AWS)...
Midea - Main
Python,数据科学,数据抓取,情感分析,敏捷数据科学...
Staude Capital
数据工程、Excel VBA、SQL、数据科学、亚马逊网络服务(AWS)...

Experience

Availability

Full-time

Preferred Environment

Amazon Web Services (AWS), Python, Big Data, PostgreSQL, SQL, PySpark, Data Modeling, Data Pipelines, Pandas, Data Scraping

The most amazing...

...我开发了一个格鲁吉亚语的聊天机器人框架.

Work Experience

Data Engineer

2023 - 2023
Amgreat North America
  • 开发用于分析社交媒体平台数据的脚本, 有助于简化数据分析和信息检索过程.
  • 实现主题建模解决方案,从复杂数据集中提取有价值的见解, 提高数据分析过程的深度和效率.
  • 使用Streamlit和Plotly库设计交互式仪表板原型, 提升数据可视化功能,增强用户参与度和理解力.
  • 在AWS上实现和部署自动化数据管道, 优化数据工作流以提高效率和可扩展性.
Technologies: Python,数据科学,Plotly,数据工程,亚马逊网络服务(AWS), GraphQL, Selenium, JavaScript, Machine Learning, Natural Language Processing (NLP), Docker, Web Scraping, ETL

Data Scientist

2023 - 2023
Midea - Main
  • 开发用于从电子商务平台收集数据的脚本.
  • 使用云服务提供商进行计算和基于人工智能的数据分析.
  • 使用AWS QuickSight设计高级洞察分析仪表板.
Technologies: Python,数据科学,数据抓取,情感分析,敏捷数据科学, Web Scraping, ETL, Machine Learning

Data Engineer

2021 - 2023
Staude Capital
  • 根据客户提供的需求和业务需求设计数据模型.
  • 开发投资者CRM系统,用于管理对冲基金交易、订单和其他操作.
  • 创建自动报告工具,并将其部署到Amazon Web Services上.
  • 建立内部沟通和通知系统.
Technologies: 数据工程、Excel VBA、SQL、数据科学、亚马逊网络服务(AWS), Hedge Funds, Python, Pandas, Data Modeling, Docker, ETL

Data Scientist

2020 - 2022
ATH Digital LLC
  • 创建数据摄取脚本,用于从谷歌广告和Facebook广告等广告平台提取数据.
  • 开发基于AWS服务的CSV和Excel文件数据自动上传到数据库.
  • 搭建数据处理管道的营销流云基础架构.
  • 根据数据科学团队的需求,设计了数据库模型.
  • 创建了一个模型,用于预测和可视化平衡燃烧率指标.
Technologies: Docker, Plotly, PostgreSQL, Jupyter Notebook, Pandas, AdWords API, Facebook API, Cron, Python, Amazon Kinesis, Amazon EC2, Docker Compose, Jupyter, Google Analytics API, Apache Airflow, Big Data, Amazon Web Services (AWS), ETL

Senior Data Scientist

2019 - 2020
Zelos.AI
  • 在AWS EMR上使用PySpark处理和分析了超过1亿个运动成绩数据.
  • 根据公司业务需求设计了数据模型.
  • 制作了一个由气流编排的批量数据处理管道.
  • 使用Scrapy, Selenium, lxml创建了一个数据抓取工具,用于解析动态和静态网页.
  • 开发了基于蒙特卡罗方法的田径比赛模拟.
Technologies: Amazon Elastic MapReduce (EMR), PySpark, Jupyter, Amazon Web Services (AWS), Statistics, Data Science, Amazon DynamoDB, Amazon EC2, lxml, Data Modeling, Database Modeling, Code Architecture, Markov Model, Markov Chain Monte Carlo (MCMC) Algorithms, Scrapy, DB, Data Scraping, Selenium, Data Engineering, Machine Learning, Generative Pre-trained Transformers (GPT), Natural Language Processing (NLP), GPT, ETL, Docker, Python, Apache Airflow, Pandas, Big Data, Web Scraping

Data Scientist

2018 - 2019
Windsor.AI
  • 优化了现有的SQL查询,使其更简单,性能更高.
  • 使用SQL获取见解,检测收集数据中的异常和问题.
  • 为不同数据库管理系统之间的数据迁移创建了一个工作流.
  • 开发脚本,用于从不同的在线广告平台获取数据.
  • 根据分析团队的需求设计新的数据库表.
Technologies: Jupyter, DB, Marketing, Google Analytics, PostgreSQL, SQL, Statistics, R, Pandas, Python, Docker, Facebook API, AdWords API, Big Data, Amazon Web Services (AWS), ETL

Data Scientist

2018 - 2019
Frontier Data Corporation
  • 开发了Twitter流趋势检测模型.
  • 开发基于ai的应用架构.
  • 将内部机器学习模型与IBM BlueMix和Google cloud NLP等云服务集成.
  • 使用Google BigQuery处理大数据集.
  • 为新的ML模型评估创建了自定义模块.
  • 训练机器学习模型用于文本分类.
  • Created tests for existing applications.
Technologies: Jupyter, DB, Time Series Analysis, R, Generative Pre-trained Transformers (GPT), GPT, Natural Language Processing (NLP), Big Data, Python, Pandas, Docker, PostgreSQL, Amazon Web Services (AWS)

Data Scientist

2016 - 2018
Pulsar AI
  • 应用机器学习和自然语言处理(NLP)技术为格鲁吉亚语言开发了聊天机器人框架.
  • 训练并部署了一个机器学习模型,用于对来自格鲁吉亚媒体网站的新闻和文章进行自动分组.
  • 设计了一个基于社交网络文本的情感分类工具.
  • 运用自然语言处理对大量用户对话数据进行分析, statistics and presented precise results.
  • 使用时间序列分析和预测加密货币价格.
  • 管理一个语言学家团队,负责数据收集和标注.
Technologies: Jupyter, DB, MongoDB, Git, Docker, NumPy, Pandas, SpaCy, fastText, Natural Language Toolkit (NLTK), Gensim, Scikit-learn, Python, PostgreSQL, Amazon Web Services (AWS), Web Scraping, ETL, Machine Learning

Software Developer Internship

2016 - 2016
Virtuace Inc.
  • Fixed bugs.
  • 扩展现有应用程序的功能.
  • Tested new modules.
Technologies: XML, Java, Git, Linux, Docker

Full-stack Software Engineer

2014 - 2016
Georgian Technical University
  • 开发管理和使用语言语料库的前端.
  • 创建了用于操作语言语料库数据的web服务.
  • 有组织的数据库结构,用于存储和操作语言语料库.
  • 使用NLP工具分析文档,并以清晰的方式呈现结果.
Technologies: DB, Python, Natural Language Toolkit (NLTK), Linguistics, MySQL, REST, JavaScript, CSS, HTML, PostgreSQL

Consumer Insights Analysis

通过开发数据收集工具创建交互式客户洞察仪表板, 对收集到的数据集进行情感分析, 并使用AWS QuickSight构建一个引人入胜且用户友好的仪表板.

Social Media Monitoring

在AWS上设计和实施自动化数据管道,用于从各种社交媒体平台收集信息,作为内部社交媒体监控服务的一部分. 开发见解、提取分析指标,并通过为产品团队量身定制的交互式仪表板呈现.

Multi-asset Hedge Fund Management System

我是一家对冲基金的数据工程师, 我通过翻译财务Excel表格和业务需求创建了一个数据模型,并在一个广泛使用的云服务上实现了一个多用户界面,以有效地管理数据库中的资产和数据. 我还建立了数据管道,从不同的银行和金融服务收集金融数据. Additionally, 我制定了报告机制和内部沟通服务,以加强组织内部的数据可及性和沟通.

Trend Detection in Twitter Stream

我使用自然语言处理算法和时间序列分析技术来创建一个模型,用于在Twitter流中进行早期趋势检测. 我还编写了脚本,利用Twitter API从Twitter流中提取和分析数据. Then, 我通过各种图表将分析结果可视化,增强了结果的可解释性.

营销优化的归因建模

I implemented attribution modeling, 一种评估沟通对关键业务目标(如销售)的财务影响的技术, customer retention, revenue, and profit. 我还广泛使用SQL进行数据操作和分析, along with Python and R libraries.

开发数据迁移和客户端通知脚本,并实施数据完整性测试,确保现有数据的完整性和准确性. During this project, 我和一个分布在不同地理位置的国际团队之间进行了有效的合作.

Advanced News Filter

使用Google BigQuery分析新闻大数据集.

训练了用于文本过滤机制的文本分类机器学习模型. 集成云机器学习服务,如IBM BlueMix和谷歌云NLP与现有的应用程序.

Chatbot Framework for Georgian Language

http://www.facebook.com/TBCTIbot/
Ti-Bot,有史以来第一个会说格鲁吉亚语的聊天机器人.

Automated News Article Grouping Tool

新闻文章分组工具将词向量化技术与聚类算法相结合,对从新闻网站解析的相似文章进行自动分组.

Social Media Sentiment Analysis Tool

社交媒体情绪分析工具是自然语言处理技术和机器学习算法的结合,用于预测评论和帖子的情绪, 从Facebook和Instagram等社交网络收集的数据.

Spell Checker for Georgian Language

拼写检查工具使用经典算法,结合强大的机器学习和自然语言处理方法来检测和纠正句子中的错误. 该产品被格鲁吉亚最大的公司用于检测和纠正文件中的错误.

格鲁吉亚方言自动识别的自然语言处理工具

用于自动识别来自不同来源(如论坛)的文档中的格鲁吉亚方言的工具, social networks, etc. 它基于机器学习分类方法和自然语言处理方法. During development, 我和一群语言学家一起工作,他们为分类模型准备训练和评估数据.

该项目荣获“第比利斯国立大学第76届学生大会最佳科研成果”。

Cryptocurrency Prices Monitoring Tool

加密货币价格监控工具使用时间序列分析算法和Tweeter API与情感分析等NLP工具相结合, 用于监控和预测比特币和其他加密货币的价格走势.

Linguistic Corpus Management System

开发了一个用于存储、操作和分析语言数据的web应用程序.

用于制药行业数据的ETL管道

与客户团队合作,为制药行业建立新的数据库, by collecting, 清理和管理来自不同来源的数据. 使用AWS服务实现ETL、存储日志等.

Simulation of the Tokio 2020 Olympic Games

解析分析大量运动员成绩数据. 应用蒙特卡罗统计方法对运动员成绩数据进行模拟田径比赛. 使用AWS云服务运行计算并存储生成的结果.

Languages

Python, SQL, XML, JavaScript, Java, HTML, CSS, R, Bash, Excel VBA, GraphQL, Python 3

Frameworks

Selenium, Flask, Scrapy, Spark

Libraries/APIs

Pandas, Beautiful Soup, REST APIs, XGBoost, SciPy, NumPy, SpaCy, Scikit-learn, Natural Language Toolkit (NLTK), Twitter API, PySpark, Google AdWords, Matplotlib, Google Cloud API, AdWords API, Facebook API, Google Analytics API, Node.js

Tools

Trello, Jupyter, GitHub, Gensim, Apache Airflow, pgAdmin, Bitbucket, Git, Cron, Plotly, Amazon Elastic MapReduce (EMR), Google Analytics, Docker Compose, Spark SQL

Paradigms

数据科学,ETL, Scrum, REST,数据库设计,异常检测

Platforms

Jupyter Notebook、Docker、Amazon Web Services (AWS)、Linux、Amazon EC2

Storage

PostgreSQL, MySQL, DB, MongoDB, Database Modeling, Amazon DynamoDB, Redshift, Data Lakes, Data Pipelines, Elasticsearch

Other

Data Scraping, Big Data, Data Engineering, Text Classification, Text Mining, Data Analysis, Data Analytics, Batch File Processing, Predictive Analytics, Apache Superset, Machine Learning, Regular Expressions, Web Scraping, Clustering Algorithms, Topic Modeling, Web Services, Data Mining, Attribution Modeling, Data Visualization, Reporting, Trading, Natural Language Processing (NLP), Markov Chain Monte Carlo (MCMC) Algorithms, Markov Model, Code Architecture, Data Modeling, lxml, fastText, Linguistics, Time Series Analysis, SSH, Computational Linguistics, Statistics, Data Structures, Algorithms, IBM Cloud, Amazon Kinesis, Hedge Funds, GPT, Generative Pre-trained Transformers (GPT), Sentiment Analysis, Agile Data Science, OpenAI, HubSpot CRM, Dash, Financial Data, Appsmith

Industry Expertise

Marketing, Healthcare

2013 - 2017

Bachelor's Degree in Computer Science

第比利斯国立伊凡·贾瓦希什维利大学-格鲁吉亚第比利斯

JUNE 2022 - PRESENT

Data Analysis Nanodegree

Udacity

MAY 2020 - PRESENT

AWS认证解决方案架构师协会2020

CloudGuru

AUGUST 2019 - PRESENT

Marketing Analytics with R

Datacamp.com

DECEMBER 2018 - DECEMBER 2019

Google Analytics Individual Qualification

Digital Academy for Ads

JULY 2017 - PRESENT

Deep Learning Summer School

University of Deusto

JANUARY 2017 - PRESENT

Deep Learning Nanodegree

Udacity

FEBRUARY 2016 - PRESENT

Machine Learning Online Course

Stanford University

FEBRUARY 2016 - PRESENT

Language and Modern Technologies

Goethe University Frankfurt/Main