Principal Machine Learning Engineer – Foundation Models in AEC

Company: Autodesk
Company: Autodesk
Location: Toronto, ON, CAN
Commitment: Full time
Posted on: 2025-09-20 05:59
Job Requisition ID #25WD89306The French translation can be found below!/La traduction en français se trouve plus bas!Position OverviewAutodesk is driving innovation in the Architecture, Engineering, and Construction (AEC) industry by embedding advanced AI into our next-generation cloud-native platforms. Across industry-defining products like AutoCAD, Revit, Construction Cloud, and Forma, we are harnessing generative AI and foundation models to transform how professionals design, build, and shape the world.As a Principal Machine Learning Engineer at Autodesk,you will provide technical leadership at the intersection of applied research and large-scale engineering, partnering with Research Scientists and cross-functional teams to accelerate innovation that helps our customers imagine, design, and make a better world. You will help guide a multidisciplinary team of scientists, engineers, and designers working on learning-based design systems, computer vision, graphics, robotics, human-computer interaction, sustainability, simulation, manufacturing, and construction. In this role, you will take ownership of advancing foundation model research in the AEC domain, leading efforts in experiment design, distributed training, optimization, and large-scale deployment to ensure efficiency and scalability.You will report to the Machine Learning Manager within the AEC Solutions organization.Responsibilities Collaborate with Research Scientists to translate novel model architectures and experimental ideas into robust, scalable implementationsDevelop, optimize, and deploy new ML models and AI techniques at scaleOwn the end-to-end training workflow: distributed training, debugging, and performance optimizationIdentify and apply best practices in large model training (e.g., parallelization, mixed precision, gradient checkpointing)Drive engineering efforts within a global team of scientists and engineers, ensuring reproducibility and efficiency of experimentsDrive throughput by identifying bottlenecks in training pipelines and implementing improvementsPartner with infrastructure and platform teams to leverage large-scale compute clusters and cloud servicesMinimum QualificationsMaster’s or PhD in a field related to AI/ML such as: Computer Science, Mathematics, Statistics, Physics, Computational Linguistics, Mechanical Engineering, or related disciplinesStrong background in deep learning, including:Implementing custom architecturesOptimizing model performanceDeveloping novel loss functionsDeploying production-ready solutionsFamiliarity with transformer-based models across various data modalities. Strong expertise in PyTorch (TensorFlow, JAX also valuable)Strong coding abilities in Python, with emphasis on debugging and performance profilingHands-on experience with distributed training frameworks (e.g., PyTorch Distributed, DeepSpeed, Megatron-LM, FSDP, Horovod) Preferred QualificationsExperience training foundation models on 2D, 3D, or multimodal data at scaleExpert-level knowledge of transformers, scaling laws, and distributed trainingDemonstrated success in optimizing training or deployment pipelines for large models, including familiarity with: Ray, DeepSpeed, Megatron, Triton, CUDA, Metaflow/MLflowFamiliarity using compute clusters and cloud services for large-scale ML pipelinesExperience with multi-GPU and large-scale training in HPC or cloud environmentsContributions to PyTorch or large-scale ML frameworksSignificant post-graduate research experience, or 5+ years of industry experience, title and level commensurate with experienceKnowledge of AEC-related data modalities (3D geometry, CAD/BIM models, construction text corpus) is a strong plusIdeal CandidateStrong builder mindset with ability to quickly implement and scale research ideasDetail-oriented, with strong debugging instincts and persistence in resolving training failuresPassion for enabling cutting-edge research through high-quality engineeringAbility to thrive in a fast-paced, collaborative research environment-------------------------------------------------------------------------------------------------------------------------------------------------Description du posteAutodesk stimule l'innovation dans le secteur de l'architecture, de l'ingénierie et de la construction (AEC) en intégrant une IA avancée dans ses plateformes cloud natives de nouvelle génération. À travers des produits phares tels qu'AutoCAD, Revit, Construction Cloud et Forma, nous exploitons l'IA générative et les modèles de base pour transformer la manière dont les professionnels conçoivent, construisent et façonnent le monde.En tant qu'ingénieur principal en apprentissage automatique chez Autodesk,vous assurerez le leadership technique à la croisée de la recherche appliquée et de l'ingénierie à grande échelle, en partenariat avec des chercheurs scientifiques et des équipes interfonctionnelles afin d'accélérer l'innovation qui aide nos clients à imaginer, concevoir et créer un monde meilleur. Vous contribuerez à guider une équipe multidisciplinaire de scientifiques, d'ingénieurs et de concepteurs travaillant sur des systèmes de conception basés sur l'apprentissage, la vision par ordinateur, le graphisme, la robotique, l'interaction homme-machine, la durabilité, la simulation, la fabrication et la construction. À ce poste, vous serez chargé de faire progresser la recherche sur les modèles de base dans le domaine de l'AEC, en dirigeant les efforts en matière de conception d'expériences, de formation distribuée, d'optimisation et de déploiement à grande échelle afin de garantir l'efficacité et l'évolutivité.Vous rendrez compte au responsable de l'apprentissage automatique au sein de l'organisation AEC Solutions.ResponsabilitésCollaborer avec les chercheurs scientifiques afin de traduire les nouvelles architectures de modèles et les idées expérimentales en implémentations robustes et évolutivesDévelopper, optimiser et déployer à grande échelle de nouveaux modèles d'apprentissage automatique et techniques d'IAGérer le flux de travail de formation de bout en bout : formation distribuée, débogage et optimisation des performancesIdentifier et appliquer les meilleures pratiques en matière de formation de modèles à grande échelle (par exemple, parallélisation, précision mixte, vérification des gradients).Diriger les efforts d'ingénierie au sein d'une équipe mondiale de scientifiques et d'ingénieurs, en garantissant la reproductibilité et l'efficacité des expériences.Améliorer le débit en identifiant les goulots d'étranglement dans les pipelines de formation et en mettant en œuvre des améliorations.Collaborer avec les équipes chargées de l'infrastructure et de la plateforme afin de tirer parti des clusters de calcul à grande échelle et des services cloud.Qualifications minimalesMaîtrise ou doctorat dans un domaine lié à l'IA/ML, tel que : informatique, mathématiques, statistiques, physique, linguistique computationnelle, génie mécanique ou disciplines connexesSolide expérience en apprentissage profond, notamment :Mise en œuvre d'architectures personnaliséesOptimisation des performances des modèlesDéveloppement de nouvelles fonctions de perteDéploiement de solutions prêtes à la productionConnaissance des modèles basés sur des transformateurs dans diverses modalités de données. Solide expertise enPyTorch (TensorFlow, JAX également apprécié)Solides compétences en codage en Python, avec un accent particulier sur le débogage et le profilage des performancesExpérience pratique des cadres de formation distribués (par exemple, PyTorch Distributed, DeepSpeed, Megatron-LM, FSDP, Horovod)Qualifications souhaitéesExpérience dans la formation de modèles de base sur des données 2D, 3D ou multimodales à grande échelleConnaissance approfondie des transformateurs, des lois d'échelle et de la formation distribuéeSuccès avéré dans l'optimisation des pipelines de formation ou de déploiement pour les grands modèles, y compris une bonne connaissance de : Ray, DeepSpeed, Megatron, Triton, CUDA, Metaflow/MLflowConnaissance de l'utilisation des clusters de calcul et des services cloud pour les pipelines ML à grande échelleExpérience avec multi-GPU et formation à grande échelle dans des environnements HPC ou cloudContributions à PyTorch ou à des cadres ML à grande échelleExpérience significative en recherche post-universitaire, ou 5 ans ou plus d'expérience dans l'industrie, titre et niveau correspondant à l'expérienceLa connaissance des modalités de données liées à l'AEC (géométrie 3D, modèles CAD/BIM, corpus de textes sur la construction) est un atout considérableCandidat idéalEsprit constructif avec une capacité à mettre en œuvre et à adapter rapidement des idées de rechercheSouci du détail, instinct de débogage et persévérance dans la résolution des échecs de formationPassion pour la recherche de pointe grâce à une ingénierie de haute qualitéCapacité à s'épanouir dans un environnement de recherche collaboratif et dynamiqueLearn MoreAbout AutodeskWelcome to Autodesk! Amazing things are created every day with our software – from the greenest buildings and cleanest cars to the smartest factories and biggest hit movies. We help innovators turn their ideas into reality, transforming not only how things are made, but what can be made.We take great pride in our culture here at Autodesk – it’s at the core of everything we do. Our culture guides the way we work and treat each other, informs how we connect with customers and partners, and defines how we show up in the world.When you’re an Autodesker, you can do meaningful work that helps build a better world designed and made for all. Ready to shape the world and your future? Join us!Salary transparencySalary is one part of Autodesk’s competitive compensation package. For Canada-BC based roles, we expect a starting base salary between $141,600 and $194,700. Offers are based on the candidate’s experience and geographic location, and may exceed this range. In addition to base salaries, our compensation package may include annual cash bonuses, commissions for sales roles, stock grants, and a comprehensive benefits package.Diversity & BelongingWe take pride in cultivating a culture of belonging where everyone can thrive. Learn more here: https://www.autodesk.com/company/diversity-and-belongingAre you an existing contractor or consultant with Autodesk? Please search for open jobs and apply internally (not on this external site).
View Original Job Posting