Progetto Apache Airflow
Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Questa pagina contiene i dettagli di un progetto di documentazione tecnica accettato per la stagione della documentazione di Google.
Riepilogo progetto
- Organizzazione open source:
- Apache Airflow
- Technical Writer:
- kartik khare
- Nome del progetto:
- Come creare un flusso di lavoro
- Durata del progetto:
- Durata standard (3 mesi)
Project description
Mi occuperò di creare la documentazione su come creare nuovi flussi di lavoro in modo facile ed efficace.
Ecco alcuni dei passaggi coinvolti nei flussi di lavoro:
- Leggi
- Pre-elaborazione
- Elaborazione
- Post-elaborazione
- Salva/azione
- Monitoraggio
Ogni passaggio può includere più attività ed è possibile eseguire una serie di azioni dopo ogni passaggio, ad esempio interrompere il job se due o più attività non vanno a buon fine o ripetere un'attività se non riesce per almeno due volte.
Un'altra parte dei flussi di lavoro include l'esecuzione di 2 o più job in parallelo e poi l'utilizzo dei risultati combinati per la fase successiva.
Un altro aspetto di un flusso di lavoro è avvisare l'utente in caso di problemi tramite posta, Slack o il servizio di pager.
Prevedo anche di includere alcuni modi non banali in cui è possibile utilizzare i flussi di lavoro, ad esempio eseguire job di flussi di dati in tempo reale al riavvio su eventuali dati mancanti negli argomenti Kafka downstream.
Collaborerò con i mentor per perfezionare l'ambito del progetto e poi completare le attività.
Non vedo l'ora di vivere questi mesi incredibili.
Salvo quanto diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.
Ultimo aggiornamento 2025-07-25 UTC.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Mancano le informazioni di cui ho bisogno","missingTheInformationINeed","thumb-down"],["Troppo complicato/troppi passaggi","tooComplicatedTooManySteps","thumb-down"],["Obsoleti","outOfDate","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Problema relativo a esempi/codice","samplesCodeIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-07-25 UTC."],[],["The project focuses on documenting the creation of new workflows for Apache Airflow. Key steps in workflows include reading, pre-processing, processing, post-processing, saving/action, and monitoring, each potentially involving multiple tasks. Workflows can handle task failures, parallel job execution, and combined result utilization. Alerting users via mail, Slack, or PagerDuty in case of errors is also part of workflows. The project will also include workflows for running real-time streaming jobs and restarting them on missing data.\n"]]