Rudolf Eremyan
Verified Expert in Engineering
Data Science Developer
鲁道夫是一名数据科学家,在该领域有8年的经验. 他为格鲁吉亚语言开发了第一个聊天机器人框架, which the largest bank in Georgia adopted. Rudolf为财富500强公司设计了基于云技术的大数据处理管道和分析解决方案. 他被邀请担任国际黑客马拉松和会议(如PyData)的演讲者和评委, Google DevFest, and NASA's international space app challenge.
Portfolio
Experience
Availability
Preferred Environment
Amazon Web Services (AWS), Python, Big Data, PostgreSQL, SQL, PySpark, Data Modeling, Data Pipelines, Pandas, Data Scraping
The most amazing...
...我开发了一个格鲁吉亚语的聊天机器人框架.
Work Experience
Data Engineer
Amgreat North America
- 开发用于分析社交媒体平台数据的脚本, 有助于简化数据分析和信息检索过程.
- 实现主题建模解决方案,从复杂数据集中提取有价值的见解, 提高数据分析过程的深度和效率.
- 使用Streamlit和Plotly库设计交互式仪表板原型, 提升数据可视化功能,增强用户参与度和理解力.
- 在AWS上实现和部署自动化数据管道, 优化数据工作流以提高效率和可扩展性.
Data Scientist
Midea - Main
- 开发用于从电子商务平台收集数据的脚本.
- 使用云服务提供商进行计算和基于人工智能的数据分析.
- 使用AWS QuickSight设计高级洞察分析仪表板.
Data Engineer
Staude Capital
- 根据客户提供的需求和业务需求设计数据模型.
- 开发投资者CRM系统,用于管理对冲基金交易、订单和其他操作.
- 创建自动报告工具,并将其部署到Amazon Web Services上.
- 建立内部沟通和通知系统.
Data Scientist
ATH Digital LLC
- 创建数据摄取脚本,用于从谷歌广告和Facebook广告等广告平台提取数据.
- 开发基于AWS服务的CSV和Excel文件数据自动上传到数据库.
- 搭建数据处理管道的营销流云基础架构.
- 根据数据科学团队的需求,设计了数据库模型.
- 创建了一个模型,用于预测和可视化平衡燃烧率指标.
Senior Data Scientist
Zelos.AI
- 在AWS EMR上使用PySpark处理和分析了超过1亿个运动成绩数据.
- 根据公司业务需求设计了数据模型.
- 制作了一个由气流编排的批量数据处理管道.
- 使用Scrapy, Selenium, lxml创建了一个数据抓取工具,用于解析动态和静态网页.
- 开发了基于蒙特卡罗方法的田径比赛模拟.
Data Scientist
Windsor.AI
- 优化了现有的SQL查询,使其更简单,性能更高.
- 使用SQL获取见解,检测收集数据中的异常和问题.
- 为不同数据库管理系统之间的数据迁移创建了一个工作流.
- 开发脚本,用于从不同的在线广告平台获取数据.
- 根据分析团队的需求设计新的数据库表.
Data Scientist
Frontier Data Corporation
- 开发了Twitter流趋势检测模型.
- 开发基于ai的应用架构.
- 将内部机器学习模型与IBM BlueMix和Google cloud NLP等云服务集成.
- 使用Google BigQuery处理大数据集.
- 为新的ML模型评估创建了自定义模块.
- 训练机器学习模型用于文本分类.
- Created tests for existing applications.
Data Scientist
Pulsar AI
- 应用机器学习和自然语言处理(NLP)技术为格鲁吉亚语言开发了聊天机器人框架.
- 训练并部署了一个机器学习模型,用于对来自格鲁吉亚媒体网站的新闻和文章进行自动分组.
- 设计了一个基于社交网络文本的情感分类工具.
- 运用自然语言处理对大量用户对话数据进行分析, statistics and presented precise results.
- 使用时间序列分析和预测加密货币价格.
- 管理一个语言学家团队,负责数据收集和标注.
Software Developer Internship
Virtuace Inc.
- Fixed bugs.
- 扩展现有应用程序的功能.
- Tested new modules.
Full-stack Software Engineer
Georgian Technical University
- 开发管理和使用语言语料库的前端.
- 创建了用于操作语言语料库数据的web服务.
- 有组织的数据库结构,用于存储和操作语言语料库.
- 使用NLP工具分析文档,并以清晰的方式呈现结果.
Experience
Consumer Insights Analysis
Social Media Monitoring
Multi-asset Hedge Fund Management System
Trend Detection in Twitter Stream
营销优化的归因建模
开发数据迁移和客户端通知脚本,并实施数据完整性测试,确保现有数据的完整性和准确性. During this project, 我和一个分布在不同地理位置的国际团队之间进行了有效的合作.
Advanced News Filter
训练了用于文本过滤机制的文本分类机器学习模型. 集成云机器学习服务,如IBM BlueMix和谷歌云NLP与现有的应用程序.
Chatbot Framework for Georgian Language
http://www.facebook.com/TBCTIbot/Automated News Article Grouping Tool
Social Media Sentiment Analysis Tool
Spell Checker for Georgian Language
格鲁吉亚方言自动识别的自然语言处理工具
该项目荣获“第比利斯国立大学第76届学生大会最佳科研成果”。
Cryptocurrency Prices Monitoring Tool
Linguistic Corpus Management System
用于制药行业数据的ETL管道
Simulation of the Tokio 2020 Olympic Games
Skills
Languages
Python, SQL, XML, JavaScript, Java, HTML, CSS, R, Bash, Excel VBA, GraphQL, Python 3
Frameworks
Selenium, Flask, Scrapy, Spark
Libraries/APIs
Pandas, Beautiful Soup, REST APIs, XGBoost, SciPy, NumPy, SpaCy, Scikit-learn, Natural Language Toolkit (NLTK), Twitter API, PySpark, Google AdWords, Matplotlib, Google Cloud API, AdWords API, Facebook API, Google Analytics API, Node.js
Tools
Trello, Jupyter, GitHub, Gensim, Apache Airflow, pgAdmin, Bitbucket, Git, Cron, Plotly, Amazon Elastic MapReduce (EMR), Google Analytics, Docker Compose, Spark SQL
Paradigms
数据科学,ETL, Scrum, REST,数据库设计,异常检测
Platforms
Jupyter Notebook、Docker、Amazon Web Services (AWS)、Linux、Amazon EC2
Storage
PostgreSQL, MySQL, DB, MongoDB, Database Modeling, Amazon DynamoDB, Redshift, Data Lakes, Data Pipelines, Elasticsearch
Other
Data Scraping, Big Data, Data Engineering, Text Classification, Text Mining, Data Analysis, Data Analytics, Batch File Processing, Predictive Analytics, Apache Superset, Machine Learning, Regular Expressions, Web Scraping, Clustering Algorithms, Topic Modeling, Web Services, Data Mining, Attribution Modeling, Data Visualization, Reporting, Trading, Natural Language Processing (NLP), Markov Chain Monte Carlo (MCMC) Algorithms, Markov Model, Code Architecture, Data Modeling, lxml, fastText, Linguistics, Time Series Analysis, SSH, Computational Linguistics, Statistics, Data Structures, Algorithms, IBM Cloud, Amazon Kinesis, Hedge Funds, GPT, Generative Pre-trained Transformers (GPT), Sentiment Analysis, Agile Data Science, OpenAI, HubSpot CRM, Dash, Financial Data, Appsmith
Industry Expertise
Marketing, Healthcare
Education
Bachelor's Degree in Computer Science
第比利斯国立伊凡·贾瓦希什维利大学-格鲁吉亚第比利斯
Certifications
Data Analysis Nanodegree
Udacity
AWS认证解决方案架构师协会2020
CloudGuru
Marketing Analytics with R
Datacamp.com
Google Analytics Individual Qualification
Digital Academy for Ads
Deep Learning Summer School
University of Deusto
Deep Learning Nanodegree
Udacity
Machine Learning Online Course
Stanford University
Language and Modern Technologies
Goethe University Frankfurt/Main