Concurso BNDES | Princípios de análise de dados e informações Com Vitor Kessler
Introdução ao Concurso do BNDS
Apresentação do Evento
- O professor inicia o evento, destacando a importância da análise de dados e informações para o concurso do BNDS.
- Menciona que abordará a matéria e como ela pode ser cobrada nas provas, além de discutir questões sobre LGPD.
Conteúdo Programático
- O edital é apresentado, enfatizando os conhecimentos transversais necessários, como princípios de análise de dados.
- A informática básica não será mais foco; agora, temas como inteligência artificial e ciência de dados são essenciais.
Análise de Dados: Estruturas e Tipos
Tipos de Dados
- Explica a diferença entre dados estruturados (formatos tabulares) e não estruturados (imagens, vídeos).
- Destaca que dados estruturados podem ser consultados em bancos de dados tradicionais, enquanto os não estruturados requerem inteligência artificial para extração.
Análise Exploratória
- Introduz conceitos básicos sobre estatística descritiva e a necessidade da ajuda de um professor especializado.
- Discute dashboards e modelos de aprendizado de máquina como ferramentas para otimização na análise dos dados.
Mineração de Dados: Processos Padrão
Ciclo CRISP-DM
- Apresenta o modelo CRISP-DM como padrão na mineração de dados, explicando suas etapas fundamentais.
- Enfatiza a importância da compreensão do negócio antes da coleta e preparação dos dados para modelagem.
Preparação dos Dados
Processo de Modelagem e Avaliação em Aprendizado de Máquina
Fases da Modelagem
- O processo de modelagem envolve o uso de um algoritmo de aprendizado de máquina que treina com uma base de dados previamente preparada, visando prever resultados.
- Após a modelagem, é realizada uma avaliação utilizando dados do mundo real que não foram incluídos no treinamento, permitindo verificar a acurácia do modelo.
- Se o modelo for aprovado na avaliação, ele é implantado; caso contrário, o ciclo recomeça para melhorar a compreensão dos dados e a preparação do dataset.
Fundamentos e Técnicas
- O CRISP-DM (Cross Industry Standard Process for Data Mining) é mencionado como um guia para as etapas do processo analítico, incluindo fundamentos para criação de métricas e KPIs.
- A coleta e preparação dos dados são destacadas como etapas cruciais no CRISP-DM, onde diversas técnicas devem ser conhecidas para montar um dataset eficaz.
Importância da Limpeza dos Dados
- É essencial remover outliers (pontos fora da curva), pois eles podem distorcer os resultados das análises. Um exemplo dado é a relação entre altura e peso em uma regressão linear.
- Outliers podem puxar a linha de regressão para baixo, resultando em previsões imprecisas sobre os dados normais.
Tratamento de Dados Faltantes
- Dados faltantes podem ser tratados através da imputação, como usar regressão linear para estimar valores ausentes com base em outras variáveis disponíveis.
- Erros nos tipos dos dados ou viés na seleção também precisam ser corrigidos antes que o modelo seja treinado.
Viés nos Dados
- O viés nos dados pode surgir quando informações erradas são coletadas. Um exemplo discutido foi sobre preconceitos nas pesquisas realizadas no Google que afetam os resultados do autocompletar.
Análise de Dados e Estatística
Importância da Estatística na Análise de Dados
- O professor menciona a contratação de um especialista em estatística para auxiliar no aprendizado, destacando sua própria experiência com a disciplina em diversas graduações e mestrados.
- A estatística é considerada uma base fundamental para entender algoritmos de aprendizado de máquina, como o Naive Bayes, que se fundamenta em probabilidades condicionais.
- A visualização de dados é crucial; o professor discute a importância dos gráficos e como interpretá-los corretamente, especialmente em provas como a do CNU.
Visualização e Interpretação de Dados
- Uma questão clássica sobre histogramas foi mencionada, enfatizando a necessidade de saber visualizar dados agrupados em intervalos específicos.
- O professor sugere que os alunos façam cursos sobre Excel para aprender boas práticas na construção de gráficos, incluindo escalas e margens.
Storytelling com Dados
- O curso sobre storytelling com dados foi destacado como essencial; o professor elogia o trabalho do Professor Thago Oliveira nesse campo.
- Storytelling envolve criar narrativas visuais que ajudam na comunicação eficaz das informações contidas nos dados. Esse tema está se tornando cada vez mais relevante em concursos.
Lei Geral de Proteção de Dados (LGPD)
- A LGPD é introduzida como uma regulamentação importante que trata do tratamento de dados pessoais, estabelecendo regras rigorosas para dados sensíveis.
- Os dados pessoais são definidos como aqueles que podem identificar um indivíduo; exemplos incluem afiliação sindical e informações políticas.
Tratamento e Consentimento dos Dados Pessoais
- O professor explica que certos tipos de informações são considerados sensíveis e não devem ser divulgados sem consentimento explícito.
- Qualquer ação envolvendo armazenamento ou processamento desses dados requer autorização do titular, conforme estipulado pela LGPD.
- A violação das normas da LGPD pode resultar em consequências legais significativas para indivíduos ou organizações.
Conclusão da Discussão
- O conteúdo abordado foi considerado valioso pelo professor, ressaltando a relevância dos temas discutidos para os participantes do evento.
Discussão sobre Dados Pessoais e Sensíveis
Tipos de Dados Pessoais
- O apresentador menciona a importância de considerar diferentes categorias de dados, como raça, etnia, convicção religiosa e filiação a sindicatos.
- A Lei Geral de Proteção de Dados (LGPD) exige um tratamento especial para dados pessoais sensíveis, com foco na segurança para evitar vazamentos.
Distinções entre Dados
- É feita uma distinção entre dados pessoais e dados pessoais sensíveis; o apresentador pede que os ouvintes identifiquem qual dado não se enquadra na categoria sensível.
- Os dados biométricos são explicados como informações coletadas através de tecnologia, como câmeras em academias que reconhecem rostos.
Consentimento e Tratamento de Dados
- O consentimento explícito é necessário para o tratamento de dados biométricos; sem ele, o uso desses dados pode ser considerado ilegal.
- O apresentador reflete sobre a natureza dos dados biométricos e sua classificação como dados pessoais sensíveis.
Questões da FGV sobre LGPD
- Uma questão da FGV é discutida onde se pergunta qual dado não é considerado sensível; a resposta correta é "convicção religiosa".
- O apresentador esclarece que data de nascimento não é considerada um dado pessoal sensível segundo a LGPD.
Exemplos Práticos e Análise Crítica
- Um exemplo prático envolve Maria fornecendo informações pessoais à empresa Alfa; arquivar essas informações caracteriza-se como tratamento sob a LGPD.
- A discussão inclui confusões comuns sobre termos relacionados à LGPD, destacando que "dados controlados" não existe no contexto legal atual.
Observações sobre Exames e Questões Recentes
- O apresentador comenta sobre as dificuldades das questões da FGV em comparação com outras bancas examinadoras, sugerindo que as questões estão se tornando mais fáceis.
O que é GAN e a Importância de Ser Generalista?
A Necessidade de Conhecimento Geral
- O apresentador discute a importância de ser um generalista, enfatizando que o conhecimento superficial sobre diversos tópicos pode ser mais útil do que especialização excessiva.
- Ele menciona o boxplot como exemplo, destacando que mesmo sem entender todos os detalhes, é crucial saber que esse gráfico é utilizado para detectar outliers em dados.
- O apresentador sugere que ter uma compreensão básica de vários conceitos pode ajudar a acertar pelo menos 60% das questões em provas.
Foco em LGPD e Estudo Contínuo
- É recomendado aprofundar-se na Lei Geral de Proteção de Dados (LGPD), pois ela está presente em muitos concursos atualmente.
- O apresentador compartilha sua experiência pessoal, mencionando que levou cerca de dois anos e meio para se preparar para concursos importantes.
Entendendo a LGPD: Titularidade e Consentimento
Conceitos Fundamentais da LGPD
- Explica o conceito de titular dos dados, afirmando que toda pessoa com dados pessoais é considerada titular e tem controle sobre suas informações.
- O consentimento do titular é essencial para o tratamento dos dados pessoais, devendo incluir as finalidades específicas desse tratamento.
Papel do Controlador e Operador
- O controlador decide como os dados serão tratados e pode contratar um operador para realizar esse tratamento em seu nome.
- Juliana, uma operadora de dados, busca entender melhor os tipos de dados sensíveis conforme descrito na LGPD.
Dados Pessoais Sensíveis: Exemplos e Implicações
Identificação dos Dados Sensíveis
- A discussão gira em torno da identificação correta dos exemplos de dados pessoais sensíveis conforme a legislação vigente.
Entendendo a Proteção de Dados Pessoais
Conceitos Básicos sobre Dados Pessoais
- A condição social do titular, como ter ou não dinheiro, é considerada dado pessoal, mas não é classificada como dado pessoal sensível.
- O consentimento do titular é fundamental para o tratamento dos dados pessoais; informações sobre vida privada e sexualidade são exemplos de dados que devem ser protegidos.
Agentes de Tratamento de Dados
- O controlador é responsável por definir o tratamento dos dados com base no consentimento do titular; o operador pode realizar o tratamento em nome do controlador.
- O encarregado atua como intermediário entre o titular, controlador e operador, facilitando a comunicação e esclarecendo dúvidas sobre o tratamento dos dados.
Autoridade Nacional de Proteção de Dados (ANPD)
- A ANPD tem a função de fiscalizar a aplicação da Lei Geral de Proteção de Dados (LGPD), garantindo que os princípios da segurança da informação sejam respeitados.
- A ANPD verifica se tanto controladores quanto operadores estão cumprindo as normas estabelecidas pela LGPD.
Exemplos Práticos na Aplicação da LGPD
- Um exemplo prático envolve uma empresa que recebe dados cadastrais e decide tratá-los para fins empresariais; isso levanta questões sobre quem deve ser considerado controlador ou operador.
- É importante entender que a empresa Alfa seria considerada controladora enquanto João Pessoa atuaria como operador no tratamento dos dados.
Definições Importantes na LGPD
- De acordo com a LGPD, um controlador pode ser uma pessoa física ou jurídica, pública ou privada, que realiza o tratamento dos dados pessoais.
- Os titulares dos dados podem incluir tanto pessoas físicas quanto jurídicas; portanto, a proteção se estende além das informações pessoais tradicionais.
Tratamento de Dados Pessoais e a LGPD
Introdução ao Caso de João
- João, um advogado, armazena dados pessoais em seu computador para fins relacionados a processos judiciais, o que o torna responsável por seguir a LGPD (Lei Geral de Proteção de Dados).
Uso Pessoal vs. Uso Comercial
- Se uma pessoa física utiliza dados pessoais para fins não econômicos, como um professor jogando Cartola, ela não precisa seguir a LGPD.
- Exemplo: Um jogador analisa estatísticas dos jogadores sem fins lucrativos; nesse caso, a LGPD não se aplica.
Responsabilidades do Controlador
- João é considerado o controlador dos dados pessoais que trata, tomando decisões independentes sobre esses dados.
- Ele atua como supervisor no tratamento de dados pessoais conforme previsto na LGPD.
Dicas para Estudo da LGPD
- É importante estudar os conceitos gerais associados à LGPD e estar preparado para questões mais complexas em provas.
- A maioria das questões abordará conceitos fundamentais como operador e controlador da LGPD; apenas algumas serão mais detalhadas.
Conclusão e Recomendações Finais
- O estudante deve ser generalista em seus estudos sobre a LGPD, pois isso facilitará o entendimento nas provas.