Projeto Apache FLink

Esta página contém os detalhes de um projeto de redação técnica aceito para a Google Season of Docs.

Resumo do projeto

Organização de código aberto:
Apache Flink
Redator técnico:
Kartik Khare
Nome do projeto:
Estender a API Table e a documentação SQL
Duração do projeto:
Duração padrão (três meses)

Project description

O Flink SQL mostra uma promessa incrível. A ideia de que você pode trabalhar com streams usando apenas SQL é óbvia, mas complicada. Acredito que o Flink SQL possa acabar eliminando a necessidade de engenheiros de dados para análises triviais de dados em tempo real, como contagem de solicitações da Uber/Lyft em várias cidades em tempo real. A primeira etapa para alcançar esse objetivo é simplificar a documentação para que alguém com experiência em análises também possa começar.

Confira algumas das melhorias que estou planejando para os documentos. Vamos discutir mais sobre isso quando começarmos a documentação. * A página de visão geral não contém exemplos. Ele precisa conter exemplos fáceis para fornecer uma introdução à API Table. * A página "Conceitos e API comum" precisa ser dividida. * As funções precisam ter uma página separada para cada categoria. As funções também devem ser listadas em uma tabela com nome, dados de entrada, parâmetros (se houver) e retornar valor como colunas. * A página "Tipo de dados" precisa conter mapeamentos adequados de tipo de dados JAVA → tipo de dados SQL. A representação atual está na forma de parágrafos, mas o ideal é que seja uma tabela. * A seção "Sintaxe da expressão" na página da API da tabela deve ter uma formatação melhor. * Uma página totalmente nova sobre os planejadores e como os usuários podem aproveitar esse recurso. * Uma página sobre otimizações que estão espalhadas por várias seções. A página de visão geral do SQL também precisa ser reformatada.

O conteúdo também precisa de uma reformulação, porque parece um pouco sobrecarregado. Também precisamos adicionar uma seção sobre onde você pode usar a API Table em vez da API Streaming com comparações, como uma diminuição nas linhas de código, melhores otimizações implícitas, melhor legibilidade e depuração mais fácil.