Lynn's Journey — BigQuery для анализа данных в сфере здравоохранения

«Будьте готовы тратить 20-25% своего профессионального времени на обучение на протяжении всей своей карьеры».

Вопросы и ответы с Линн

  • А: Так много! Мои любимые облачные сервисы Google — CloudRun, BigQuery, Dataproc. Любимые инструменты — редактор Cloud Shell, браузер с поддержкой SSH для Compute Engine и сведения о выполнении больших запросов.
  • О: Мне нравится использовать инструмент Variant Transforms с открытым исходным кодом для файлов данных VCF [или геномных]. Этот инструмент позволяет биоинформатикам быстро работать с BigQuery. Исследователи используют инструмент VariantTransforms для проверки и загрузки файлов VCF в BigQuery. VariantTransforms поддерживает рабочие нагрузки анализа данных в масштабе генома. Эти рабочие нагрузки могут содержать сотни тысяч файлов, миллионы геномных образцов и миллиарды входных записей.
  • Ответ: Я работал с командами по всему миру над созданием, масштабированием и развертыванием нескольких конвейеров данных геномного масштаба для здоровья человека. Недавние примеры использования — это анализ данных в поддержку разработки лекарств от Covid или рака.
  • Ответ: Будьте готовы тратить 20–25% своего профессионального времени на обучение на протяжении всей своей карьеры. Все общедоступные облачные сервисы, включая Google Cloud, постоянно развиваются. Для эффективного построения требуется знание как облачных шаблонов, так и сервисов на глубоком уровне.

Вы могли бы

Посмотрите, как другие сообщества разработчиков решают серьезные задачи и оказывают еще большее влияние на наш мир.