Sebastián Castaño,德国柏林的开发人员
Sebastián is available for hire
Hire Sebastián

Sebastián Castaño

Verified Expert  in Engineering

数据科学家和机器学习开发人员

Location
Berlin, Germany
Toptal Member Since
September 13, 2021

Sebastián拥有机器学习和数据科学博士学位,在医学跨学科项目方面有十年的经验, banking, marketing, and consumer products, among others. 他的专长包括设计数据收集系统, 分析和建模复杂的数据, 开发和部署机器学习管道. 作为一个经验丰富的研究者和教育家, Sebastián不断为技术和非技术同事提供令人信服的数据驱动见解和直观工具.

Portfolio

Stealth Startup
生成预训练变形(GPT), GPT...
全球食品和饮料公司
Python,机器学习,SQL, TensorFlow, Docker,亚马逊网络服务(AWS)...
D-fine
机器学习,SQL, Python, R, Java,神经网络,统计建模...

Experience

Availability

Part-time

Preferred Environment

Windows, Linux, Spyder, PyCharm, Jupyter Notebook, Scikit-learn, Visual Studio Code (VS Code), Git, Docker

The most amazing...

...我开发的项目是一个基于ml的, 优化帕金森病和特发性震颤患者脑刺激治疗的闭环系统.

Work Experience

Co-founder

2022 - PRESENT
Stealth Startup
  • 共同创立了一家为IT团队开发知识管理框架的公司.
  • 利用基于变压器的自然语言处理模型开发并实现了一个多领域语料库分析系统.
  • 设计和部署AWS基础设施,为神经搜索引擎提供服务.
技术:生成预训练变压器(GPT), GPT, 自然语言处理(NLP), 亚马逊网络服务(AWS), SQL, Docker, Generative Systems, OpenAI, Text Processing

机器学习工程师

2021 - 2022
全球食品和饮料公司
  • 作为MLOps团队的一员,为新的地域市场和产品系列建立并推出现有的媒体组合模型.
  • Designed, implemented, 并为基于贝叶斯统计建模的媒体混合模型部署了PoC,作为ML R的成员&D team.
  • 领导由五名机器学习工程师和数据科学家组成的团队. The team developed, benchmarked, productized, 并为营销团队部署了下一代媒体组合模式.
Technologies: Python,机器学习,SQL, TensorFlow, Docker,亚马逊网络服务(AWS), Bayesian Statistics

Consultant

2021 - 2021
D-fine
  • 验证了一家大型德国银行的信用风险和会计模型.
  • 在德甲球队对足球运动员的伤病预测和人才培养数据进行预测性和规范性的统计分析.
  • 为一家大型欧洲银行部署数据管理系统.
  • 开发MLOps管道, 包括神经网络的架构优化, for an in-house project.
Technologies: 机器学习,SQL, Python, R, Java,神经网络,统计建模, Predictive Analytics, Bayesian Statistics, Data Analysis, Data Analytics, Data Science, 机器学习操作(MLOps), Scikit-learn, Probability Theory, PyTorch, Statistics, Statistical Methods, Seaborn, Matplotlib, 数据库管理系统(DBMS), Data Warehousing, CI/CD Pipelines, Jupyter, Statistical Analysis, 人工智能(AI), NumPy, Consulting

博士研究助理

2014 - 2020
University of Freiburg
  • 开发了第一个基于机器学习的, closed-loop, 脑深部电刺激系统在自由活动患者中的应用. 与这一成就相关的项目是在临床医生和行业伙伴的密切合作下进行的.
  • 建立了数据驱动的适应性脑深部刺激作为大学的一个新的研究领域.
  • 在同行评议的科学期刊上发表了7篇研究论文,并在机器学习领域的科学研讨会和会议上发表了10多篇论文, data science, and neuroscience.
  • 支持计算机科学硕士项目的机器学习讲座5年,以练习、考试和辅导为概念. 该讲座的平均出席人数为每学期100人左右.
  • 指导一个2-5人(有偿)的硕士研究助理团队完成实验室的辅助任务.
  • 指导15名以上学生在实验室完成硕士和学士学位论文.
技术:机器学习, 数字信号处理, Data Science, Research, Neuroscience, Statistics, Data Analysis, Data Analytics, Writing & Editing, Matplotlib, Pandas, Scikit-learn, Time Series Analysis, Control Theory, Probability Theory, Linear Algebra, Deep Learning, Reinforcement Learning, Python, MATLAB, Technical Writing, PyTorch, Statistical Methods, Data Engineering, Seaborn, Neural Networks, Predictive Analytics, Statistical Modeling, Jupyter, AutoML, 人工智能(AI), NumPy, Consulting, 分类算法

Research Assistant

2012 - 2014
哥伦比亚国立大学
  • 作为唯一的讲师讲授模拟电子学课程. 除了准备讲座, exercises sheets, and exams, 我监督学生项目的执行.
  • 指导一名(带薪)本科生助教讲授模拟电子学.
  • 开发了神经信号源定位的新方法, 结果在同行评议的期刊上发表了一篇科学论文.
技术:贝叶斯统计, Linear Algebra, Research, Neuroscience, MATLAB, Python, Probability Theory, Statistical Analysis, 人工智能(AI), NumPy

基于NLP方法的研究发现引擎

机器学习团队中知识管理和发现框架的概念和发展. 该产品被定义为机器学习研究的发现引擎, 解决信息溢出的问题,比如每天有100多篇机器学习论文上传到arXiv.

Key Activities
•实现一个PoC系统,该系统由一个发现引擎组成,用于使用大型语言模型进行机器学习研究.
•设计和部署服务于发现引擎的云基础设施.
•创建商业模式和市场策略.
•对50多名受访者进行用户发现和开发访谈.

消费类产品的媒体组合模型

Development, implementation, 并为公司的全球运营部署了基于贝叶斯统计模型的营销组合模型.

Key Activities
•实施基于最新研究论文的学习模式.
•根据可用数据的特定属性定制模型.
•将模型部署到云上,供MLOps团队使用.
•利用来自业务部门的反馈反复改进模型.
•向业务部门的几个非技术利益相关者展示结果.

基于ml的特发性震颤患者适应性深部脑刺激系统

http://www.frontiersin.org/articles/10.3389/fnhum.2020.541625/full
首个基于机器学习的自适应深度脑刺激系统在自由活动的特发性震颤患者中实现. 这个项目是与华盛顿大学的同事合作完成的.

Key Activities
•建立了我们在弗莱堡大学的研究实验室(大脑状态解码实验室)和华盛顿大学(生物机器人实验室)之间的合作.
•构思并开发底层机器学习, control, 以及数字信号处理方法.
•将算法部署在主机PC和患者神经刺激器的嵌入式系统上.
•执行数据收集实验.
•对收集的数据进行离线分析.
•撰写并编辑了同行评审出版物的最终手稿.

某足球队伤病数据分析

德甲足球队伤病数据的描述性和规范性分析. 在我分析了数据并将结果呈现给所有利益相关者之后, 包括非技术人员, 该项目成为该团队研究部门的一部分,旨在研究伤害预防和人才发展.

Key Activities
•准备和清理来自多个数据库的数据.
•对数据进行描述性和规范性分析.
•将结果呈现给所有利益相关者,包括非技术人员.

数据管理系统的部署

移交欧洲一家大型银行用于信用风险数据仓储和分析的数据管理系统.

Key Activities
•配置和部署UAT和生产环境.
•为后端和前端实现了CI/CD管道.

从大脑信号中解码帕金森病症状

http://www.sciencedirect.com/science/article/pii/S2213158220302138
一种新的监督机器学习方法,用于从大脑信号中解码帕金森病症状的强度. 我们收集了7名接受深部脑刺激治疗的患者的数据,并表明我们的新ML方法提高了症状的解码性能.

Key Activities
•设计并执行数据收集实验.
•对数据进行预处理并进行探索性数据分析.
•构思并实现了新的ML方法.
•用收集到的数据和最先进模型的基准验证了新的ML方法, 包括深度卷积神经网络.
•应用AutoML对所有考虑的模型进行超参数优化.
•撰写并编辑了在同行评审期刊上发表的最终手稿.

神经科学中ML的数据增强框架

http://www.frontiersin.org/articles/10.3389/fninf.2019.00055/full
该项目开发的新框架允许对新的ML算法进行客观评估和基准测试,以分析神经学数据.

我们应对了以下挑战:
•在使用数据驱动的方法分析大脑信号时,缺乏可用的数据.
•可用标签不可靠
•原始信号中的高水平噪声.

Key Activities
• Conceived the idea.
•执行数据分析.
•撰写了发表在同行评议期刊上的科学手稿.

Languages

Python, SQL, R, Java, C#

Libraries/APIs

Scikit-learn, Matplotlib, Pandas, NumPy, PyTorch, React, TensorFlow

Tools

Spyder, MATLAB, Git, Seaborn, Jupyter, AutoML, PyCharm, Excel 2010

Paradigms

数据科学,用户验收测试(UAT)

Platforms

Windows, Linux, Jupyter Notebook, Docker, JBoss EAP, 亚马逊网络服务(AWS), Visual Studio Code (VS Code)

Other

数字信号处理, Programming, Time Series Analysis, Linear Algebra, Machine Learning, Neuroscience, Deep Learning, Research, Technical Writing, Statistics, Statistical Methods, Data Analytics, Data Analysis, Data Engineering, Neural Networks, Statistical Modeling, Predictive Analytics, Writing & Editing, Statistical Analysis, 人工智能(AI), Consulting, 分类算法, Probability Theory, Reinforcement Learning, Bayesian Statistics, Algorithms, Electronics, 自然语言处理(NLP), OpenAI, Text Processing, GPT, 生成预训练变压器(GPT), Circuit Design, Control Theory, Calculus, 机器学习操作(MLOps), Data Warehousing, CI/CD Pipelines, Generative Systems, 大型语言模型(llm), Business Planning, IT Project Management, 自然语言理解(NLU), Customer Research

Storage

数据库管理系统(DBMS)

2014 - 2020

PhD in Computer Science

弗莱堡大学-德国弗莱堡

2012 - 2014

工程硕士学位

哥伦比亚国立大学-马尼萨莱斯,哥伦比亚

2007 - 2012

电子工程工程师学位

哥伦比亚国立大学-马尼萨莱斯,哥伦比亚

Collaboration That Works

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring