Ruggiero Dargenio,瑞士z<e:1>里奇的开发者
Ruggiero is available for hire
Hire Ruggiero

Ruggiero Dargenio

Verified Expert  in Engineering

大数据工程师和开发人员

Location
Zürich, Switzerland
Toptal Member Since
July 12, 2022

Ruggiero是一个拥有超过五年数据工程经验的真实世界数据专家, 为NLP和网络安全领域的各种用例开发模型. 拥有软件工程背景和苏黎世联邦理工学院和麻省理工学院的计算机科学硕士学位, 他已经编码超过15年了. Ruggiero还擅长为不同的金融机构创建基于大数据技术的管道和ETL转换.

Portfolio

Duenders LLC
谷歌云平台(GCP)、GPT、生成预训练变形器(GPT)...
Deloitte
Python, PySpark, Foundry, Pandas, SQL, Rundeck, Jira,数据可视化...
Credit Suisse
Python, PySpark, Scikit-learn, SQL, Pandas, Jira,数据科学,数据管道...

Experience

Availability

Part-time

首选的环境

Machine Learning, Data Engineering, Scikit-learn, Pandas, PySpark, TensorFlow, PyTorch, Docker, SQL, Python

The most amazing...

...我开发了一个端到端的机器学习解决方案,用于网络威胁检测.

Work Experience

Lead Data Scientist

2021 - PRESENT
Duenders LLC
  • 开发了一种基于吉娜和变形金刚嵌入的神经搜索.
  • 部署在云上的无服务器容器按照特定的时间表运行.
  • 监督金融科技领域的网络和移动应用程序的开发.
Technologies: 谷歌云平台(GCP)、GPT、生成预训练变形器(GPT), 自然语言处理(NLP), Docker, 大型语言模型(llm), 人工智能(AI), 亚马逊网络服务(AWS), 亚马逊机器学习, Amazon S3 (AWS S3), Snowflake

Big Data Engineer

2021 - PRESENT
Deloitte
  • 致力于全公司范围的解决方案,以拥有来自多个来源的数据的客户的独特视图.
  • 构建ETL管道,使用基于Palantir Foundry的大数据技术从各种数据库系统中提取和摄取数据.
  • 开发并测试了为数据湖提供提要的数据源及其在生产环境中的部署.
  • 通过将业务逻辑与消费者需求集成来设计管道规范.
  • 与项目经理和业务分析师沟通,优化数据管道的效率.
Technologies: Python, PySpark, Foundry, Pandas, SQL, Rundeck, Jira,数据可视化, Data Engineering, Data Science, Data Pipelines, Data Modeling, Spark SQL, Spark, 人工智能(AI)

Data Modeler

2020 - 2021
Credit Suisse
  • 作为承包商参与建模和分析不同的财务数据,以识别洗钱活动.
  • 在由多达10名开发人员和业务分析师组成的敏捷工作流中担任产品负责人. 确定业务需求并确定其优先级, 然后将它们转换为技术实现任务.
  • 分析了以可解释性为重点开发的机器学习模型.
  • 确保模型技术性能指标反映了业务用例.
  • 使用基于Spark集群的最先进的大数据技术对客户的交易行为进行临时分析,以检测洗钱模式.
  • 提出并参与实施项目范围战略, productionalization, 以及部署后对ML模型的监控.
  • 代表团队讨论与外部数据提供者的合作.
Technologies: Python, PySpark, Scikit-learn, SQL, Pandas, Jira,数据科学,数据管道, Spark SQL, Spark, 人工智能(AI)

Data Scientist

2018 - 2020
BIS——国际清算银行
  • 开发端到端系统,识别各种网络威胁和恶意行为.
  • 构建基于npl的检测模型-垃圾邮件分类器构建在BERT之上,使用PyTorch实现, scikit-learn安全事件响应平台中网络警报的优先级模型, 以及用于处理命令行的异常检测器.
  • 开发了基于网络流量的检测模型, 目标DNS隧道, admin access traffic, 恶意域名. 数据处理使用PySpark, ML模型使用MLlib.
  • 与团队合作开发基于Apache和Cloudera产品的BIS大数据平台. 收集硬件需求,选择软件工具,并定义用例.
Technologies: Python, PySpark, Scikit-learn, Pandas, MLlib, TensorFlow, PyTorch, SQL, Data Science, Spark SQL, Spark, Language Models, Text Generation, 大型语言模型(llm), 人工智能(AI)

Purse

这是一款创新的优惠券移动应用程序,它使用开放式银行服务来根据客户的特定兴趣定制折扣. 该系统将根据用户的支出推荐优惠券,以提供有效的有针对性的版税计划.

Languages

SQL, Python, Snowflake

Frameworks

Spark

Libraries/APIs

Scikit-learn, Pandas, PySpark, TensorFlow, PyTorch, MLlib

Tools

Spark SQL, Jira, Rundeck

Paradigms

Data Science

Storage

数据管道,Amazon S3 (AWS S3)

Other

Machine Learning, Data Engineering, Language Models, 人工智能(AI), Deep Learning, Data Modeling, Text Generation, 自然语言处理(NLP), 大型语言模型(llm), 亚马逊机器学习, GPT, 生成预训练变压器(GPT), Engineering, Software Engineering, Physics, Big Data, Data Mining, Foundry, Data Visualization, Serverless, Speech Recognition, Prompt Engineering

Platforms

亚马逊网络服务(AWS)、Docker、Kubernetes、谷歌云平台(GCP)

Industry Expertise

Telecommunications

2017 - 2018

计算机科学硕士论文

麻省理工学院-美国波士顿剑桥市

2015 - 2018

计算机科学硕士学位

苏黎世联邦理工学院-苏黎世,瑞士

2012 - 2015

软件工程学士学位

米兰理工大学-米兰,意大利