Accélérer la science des données sur les GPU

Quel est le principal avantage de l'utilisation de `cudf.pandas` dans votre workflow de data science ?

Il fournit de nouvelles fonctions pandas qui ne sont pas disponibles dans pandas standard.

Il accélère automatiquement les opérations pandas sur GPU sans aucune modification de code.

Elle réduit l'empreinte mémoire des DataFrames pandas.

Il permet le calcul distribué sur plusieurs machines.

Quel environnement d'exécution sur Google Cloud est recommandé pour les équipes qui souhaitent une configuration rapide, une facilité d'utilisation et une collaboration sécurisée pour les workflows de data science avec les notebooks ?

Compute Engine

Vertex AI Workbench

Colab Enterprise

Cloud Functions

Dans le contexte du machine learning accéléré par GPU, qu'est-ce que l'exécution des profileurs `cuml.accel` vous aide-t-elle à identifier ?

Fuites de mémoire dans votre code Python

Problèmes de latence du réseau

Replis du processeur et goulots d'étranglement des performances

Erreurs de syntaxe dans votre notebook

Quelle est la bonne pratique à suivre lorsque vous utilisez l'accélération GPU pour le machine learning ?

Toujours utiliser le GPU pour les ensembles de données de toutes tailles

Utiliser le format CSV pour charger les données le plus rapidement possible

Utiliser le format Parquet et privilégier les opérations vectorisées

Traiter les données ligne par ligne pour un contrôle maximal

Quel paramètre devez-vous définir dans XGBoost pour activer l'accélération GPU ?

gpu=True

accelerator='gpu'

device='cuda'

use_gpu=1

Quel est l'avantage clé d'utiliser les estimateurs de `cuML` (par exemple, `cuml.ensemble.RandomForestClassifier`) par rapport à leurs équivalents `scikit-learn` ?

Ils sont compatibles avec plus d'options d'hyperparamètres que scikit-learn.

Ils entraînent les modèles sur GPU, ce qui réduit considérablement les temps d'ajustement et de prédiction sur les grands ensembles de données.

Elles effectuent automatiquement l'ingénierie des caractéristiques avant l'entraînement.

Ils éliminent le besoin de réglage des hyperparamètres.

Lorsque vous utilisez XGBoost accéléré par GPU avec des objets DataFrame `cuDF`, quel est l'avantage principal de transmettre directement des données `cuDF` à `xgb.train()` ou `XGBClassifier.fit()` ?

Il ajuste automatiquement le taux d'apprentissage.

Elle évite les transferts de données coûteux entre la mémoire du GPU et celle du CPU.

Il permet l'entraînement sur plusieurs GPU par défaut.

Il convertit automatiquement les caractéristiques catégorielles en valeurs numériques.

Que vous permet de faire le module `cuml.accel` lorsque vous travaillez avec du code `scikit-learn` ?

Convertir automatiquement des modèles scikit-learn au format ONNX

Exécuter le code scikit-learn existant sur GPU avec un minimum de modifications, voire aucune

Répartissez l'entraînement scikit-learn entre plusieurs nœuds de processeur

Sélectionner automatiquement le meilleur algorithme pour votre ensemble de données

`cuml.accel.profile` et `cuml.accel.line_profile` permettent de profiler votre code `scikit-learn` accéléré par GPU. Quelles sont les méthodes valides pour les appeler ?

Ajoutez %%cuml.accel.profile en haut d'une cellule de notebook.

Ajoutez %%cuml.accel.line_profile en haut d'une cellule de notebook.

python -m cuml.accel --profile your_code.py

python -m cuml.accel --line-profile your_code.py

Toutes les réponses ci-dessus

Quel est le principal avantage de l'utilisation de cudf.pandas dans votre workflow de data science ?

Quel environnement d'exécution sur Google Cloud est recommandé pour les équipes qui souhaitent une configuration rapide, une facilité d'utilisation et une collaboration sécurisée pour les workflows de data science avec les notebooks ?

Dans le contexte du machine learning accéléré par GPU, qu'est-ce que l'exécution des profileurs cuml.accel vous aide-t-elle à identifier ?

Quelle est la bonne pratique à suivre lorsque vous utilisez l'accélération GPU pour le machine learning ?

Quel paramètre devez-vous définir dans XGBoost pour activer l'accélération GPU ?

Quel est l'avantage clé d'utiliser les estimateurs de cuML (par exemple, cuml.ensemble.RandomForestClassifier) par rapport à leurs équivalents scikit-learn ?

Lorsque vous utilisez XGBoost accéléré par GPU avec des objets DataFrame cuDF, quel est l'avantage principal de transmettre directement des données cuDF à xgb.train() ou XGBClassifier.fit() ?