[Música] Olá pessoal tudo bem seja novamente bem-vindos a nossa sétima semana do curso hoje a gente vai falar um pouquinho então sobre análise de sentimentos né os tópicos que a gente vai abordar na vídeo aula de hoje é fazer uma introdução né esse tópico de análise sentimentos falar sobre opinião que é bastante importante alguns conceitos importantes que tem bastante relação com essa linha de análise de sentimentos sobre emoções também né porque quando a gente fala de sentimentos a gente tá falando de Emoções então é importante também mostrar para vocês algumas ideias em relação a isso
e por fim falar sobre algumas aplicações né que são interessantes né de análise de sentimentos tá bom inicialmente Então a gente vai fazer uma definição vou até ler aqui para vocês né uma das definições que a gente tem aí para o que que é a nossa análise sentimentos né que seria então a área de estudo que Analisa as opiniões sentimentos avaliações apreciações atitudes e Emoções das pessoas em relação à entidades como produtos serviços organizações de indivíduos questões eventos tópicos e todos os seus atributos relacionados Então aqui tem a referência de Liu de 2012 né que
fez uma definição uma das definições que a gente tem aí para essa área a gente consegue ver que é uma área de aplicação bastante Ampla né e embora a gente tem visto na semana passada um exemplo sobre um exemplo específico de classificação de textos que também era uma das aplicações de análise sentimentos a gente vê que não é restrito é isso né Tem várias outras ideias que podem ser utilizadas nessa nessa linha né então a gente tem aqui muitos nomes né que são relacionados né com essa área de análise de sentimentos né então de alguma
forma elas são utilizadas de um jeito Por uns de outro jeito por outros né E algumas nuances Diferentes né mas a gente tem aqui alguns exemplos né que além de análise sentimentos a gente também tem mineração de opiniões extração de opiniões mineração de sentimentos análises de subjetividades e assim por diante né então tem algumas variações aí de nomenclatura para esse conceito que a gente tá vendo aqui que abrange basicamente tudo isso né e aqui a gente vai ver algumas razões né que motivaram né o interesse nessa área né que é uma área até até recente
pelo menos com esse nome que a gente tem utilizado né mas isso já vem de muito tempo né sendo objeto de interesse né de de vários ramos né e de diversos níveis de de interesse como a gente vai ver aqui por exemplo né Tanto do lado de empresa em nível de empresa em nível de consumidor vai até mesmo do ponto de vista acadêmico né então do lado de empresas por exemplo né qual o interesse da empresa em trabalhar com esse tipo de aplicação né Por exemplo para saber entender sobre aceitação de seus produtos e serviço
o produto é ou não aceito né então a gente vê o que muito não é de hoje que muito tempo muitos anos já décadas aí que se faz aquela pesquisa de mercado antes mesmo até dia de se lançar um produto né então com certeza hoje isso é muito mais fácil de fazer digamos assim né dada disponibilidade de dados que a gente tem aí principalmente com a internet né do que se era antigamente né bom também é interessante para avaliar o desempenho dos concorrentes né ou a retroalimentação na linha de fabricação bom do lado do ponto
de vista dos consumidores né então a gente também tem sempre o interesse do Consumidor o nosso interesse como consumidor olhar a qualidade dos produtos e serviço né isso a gente faz muito né Às vezes a gente vai comprar um produto num site como da Amazon por exemplo no mercado livre seja lá qual for eu pelo menos fácil né então eu vou ver alguns produtos a gente vê que tem muita coisa parecida eu olho para as notas né para as notas que as pessoas dão para aquele produto é críticas e sugestões claro que fazer isso de
forma manual como a gente faz na hora de comprar alguma coisa é um pouco mais difícil Principalmente quando a gente tem um item lá que tem dezenas centenas e milhares de avaliações né e a gente acaba olhando mais para aquele número mesmo né um número no score que a gente chama de que vai de 1 a 5 por exemplo né mas a gente utiliza isso é de interesse da gente saber é baseado na opinião dos outros a qualidade daquele produto né também para fazer uma análise de custo-benefício então às vezes a gente vai lá ver
um produto que tem uma nota boa é 4,5 o produto tem uma nota 4,5 que custa r$ 200 mas a gente vai lá e vê um outro que tem uma nota 4,4 e custa 100 bom a gente vai acabar optando por pegar eles que o custo-benefício é muito próximo né ou não é o dobro da qualidade para ser o dobro do preço né por exemplo e do ponto de vista acadêmico né a gente tem alguns desafios também aqui interessantes né Por exemplo o volume de dados que nem eu falei para vocês né hoje em dia
a gente tem muita quantidade de dados e se há um desafio para de ponto de vista acadêmico para poder lidar mais com essas situações tanto para armazenar como para processar esses dados para poder atingir os objetivos que a gente quer atingir né como por exemplo quando a gente vai trabalhar com análise de sentimentos né a língua real né isso também é Um Desafio interessante um dos principais desafios que a gente tem é justamente esse curso que a gente tá tendo aqui de processamento de linguagem natural né Essa é um dos principais desafios acadêmicos que a
gente tem né É um tópico de pesquisa atualmente né é um dos Hot tópicos na área de pesquisa tanto a parte de visão computacional como a parte de processamento de linguagem natural vamos dizer assim esses dois tópicos aí estão muito em alta né que envolve Claro toda a parte de machine learning e especialmente o aprendizado profundo que a gente já começou também a ver aqui no curso né entre outros várias outras áreas de interesse aí que a gente tem no ponto de vista acadêmico também tá então Até recentemente né como eu tava mencionando para vocês
né como é que a gente fazia isso a gente gostava amigo os familiares para saber né ter uma indicação de um filme tem uma indicação de algum produto para comprar etc né e as empresas elas também faziam isso nas conduziam contratava-se as pesquisas de opinião juntamente com usuários como eu tinha mencionado para vocês né não era feita de uma forma tão complexa vamos dizer de forma automática como atualmente o processamento é complexo mas para empresa né o procedimento é menos Custoso vamos dizer assim né porque não é manual é automático E aí a gente tem
então que a web né e a tecnologia né da linguagem elas apareceram evoluir muito então hoje em dia tudo que se faz é dessa forma né que a gente tá vendo aqui né Então a gente tem alguns desafios nessa área né de análise de sentimentos e principalmente quando a gente trata sobre sobre a linguagem natural utilizar a linguagem natural para poder fazer esse tipo de avaliação né então primeiro que a gente tem muita informação mas essa quantidade de informação não quer dizer qualidade vamos dizer assim então a gente tem muita coisa também que é relevante
muita coisa que é relevante então a gente já tem um desafio aí que é como que a gente faz para selecionar o que que é relevante porque tem que ter alguma forma de selecionar quando a gente vai fazer uma análise é só aquele aquelas informações que são relevantes porque senão quando a gente tem aquela informação e relevante junto vai lá Acaba atrapalhando além de não ajudar Acaba atrapalhando na hora de fazer o processamento né a gente tem fontes e formatos completamente diferentes né isso também é Um Desafio interessante né normalmente se tenta fazer o máximo
possível poder fazer uma integralização desses dados para poder trabalhar eles tudo com todos eles em uma única de uma única forma né Mas isso não é fácil é Um Desafio porque os dados são armazenados em lugares diferentes formas diferentes né muitas vezes como é o nosso caso aqui dados não estruturados que vai trabalhar com texto com e não só texto né às vezes se fosse um texto escrito perfeito com as palavras escritas de forma perfeita gramaticamente correto e etc e tal já seria difícil mas seria muito mais muito menos difícil do que é quando a
pessoa começa a inserir colocar gírias né e escrever errado e estudo a gente não o computador é um desafio para o computador ele tem uma dificuldade a mais para poder lidar com esse tipo de coisa né tem questão de variedade temporal variável temporal Às vezes uma coisa que vale 20 anos atrás hoje já não vale mais ou em muitas situações em dois meses atrás já não vale mais hoje também né a gente sabe que tem muito disso Então os dados que não segue a norma culta como mencionei para vocês né abreviaturas fatos ou boatos também
ou Malícia manipulação porque às vezes da Verdade a pessoa está colocando algo lá mas não é de Fato né um sentimento ou uma opinião na verdade o conteúdo malicioso Então como é que se faz para lidar com esse tipo de situação também né então a gente também tem diversos níveis de análise né a gente já trabalhou com isso e faz parte inclusive do contexto todo de PLN tem um nível de documentos né quando a gente trabalha com documento um texto né para expressar uma opinião positiva ou negativa sobre determinado tópico então em geral a gente
considera só um tópico né a gente pode estar no nível de sentença também né se uma sentença uma única frase né Ela é positiva e negativa ou neutra em relação alguma coisa e também pode estar em nível de aspecto né que é um nível um pouco mais sofisticado e desafiador né então aspectos positivos e negativos de uma entidade alvo né então a gente teria que por exemplo que apesar da qualidade de chamada do iPhone ser boa a vida útil de sua bateria é curta Então qual é o aspecto que a gente estaria levando em consideração
aqui né Então esse também é interessante né bom outra característica importante também que a gente precisa falar um pouquinho aqui é questão da polaridade de opiniões né Então quais são como é que a gente como é que a gente determina né o a polaridade das opiniões né então a gente teria que um exemplo que é bastante utilizado que seria uma polaridade positiva negativa ou neutra né que essa definição ela pode até variar né como por exemplo sem polaridade ou com mais de uma polaridade né então é algo que se trabalha bastante também né Tem uns
trabalhos que falam também níveis de polaridade né não se restringe a isso né E também às vezes a forma com que a gente sai de um score por exemplo né Às vezes o nível de polaridade ele tá numa nota mas como é que a gente sai para um sentimento né de forma positiva negativa neutra né na aula prática a gente vai ver um exemplo de como a gente faz para sair de um da nota e passar para um consentimento desse com esses polos aqui positivo e negativo e neutro mas a gente sabe que não existe
um jeito único de fazer isso né e porque às vezes uma pessoa dá uma nota por exemplo um é mais exigente que o outro né então vou dar uma nota de 1 a 5 eu sou muito exigente para mim tá ótimo botar três três para mim uma boa nota mas para outra pessoa três Ah não gostei muito vou botar três ou outro coloca três Porque ele acha que não é muito bom e também acho que não é muito ruim né Então depende muito também da pessoa que está colocando isso né um por isso que é
uma das questões também bem difíceis de entender né então alguns casos ela é ambígua também tem umas situações assim de frases como é que a gente vai emitir opinião com frases que são ambíguas e polivalentes por exemplo eu gosto da escola mas o professor é chato a gente tá aqui numa ideia de querer dar uma opinião sentimentos sobre uma sentença mas a gente tá vendo aqui que tem como é que a gente vai avaliar essa sentença que ela é positiva para um ponto de vista pela escola mas ela é negativa pelo ponto de vista se
a gente for analisar o professor né mas como é que a gente chega um uma opinião em relação a essa sentença assim uma única opinião é complicado né porque ela é umbigo e Polivalente né aí a gente tem também as opiniões diferentes tipos de opiniões né como regulares e comparativas né a gente pode ter uma opinião regular direta por exemplo a coca-cola tem um gosto bom né ou indireta depois de tomar o remédio a dor passou né então a coca-cola tem um gosto boa direto a gente já tá falando bem da coca-cola mas depois de
tomar o remédio a dor passou como é que a gente que que a gente tem aqui de opinião a gente tá querendo dar uma opinião Positiva em relação ao remédio né mas aqui não tá dizendo explicitamente que o remédio é bom mas a gente consegue olhar aqui e ver que é né porque se a dor passou porque o remédio é bom mas não tá escrito diretamente como uma frase anterior né ou às vezes a gente tem também a opinião comparativa né quando valia Multiplus para as entidades como a coca-cola é melhor do que a Pepsi
por exemplo né bom importante também a gente mencionar aqui que nem sempre o sentimento ele é explícito né então a gente tem algumas sentenças que são subjetivas né como refrigerante é ruim ou eu amo o smartphone Tá mas amo quanto né quão ruim que é né é subjetivo né a gente não contém um valor explícito né como teria por exemplo aqui uma sentença mais objetiva como a câmera quebrou em dois dias a gasolina durou 10 dias então a gente tem uma informação um pouco mais explícita né a sentença mais objetiva outra coisa interessante também a
gente avaliar tanto ponto de vista como o momento também que é dada essa opinião o que é dito alguma coisa né então quando o ponto de vista Ela depende também de quem fala e de quem ouve isso também é importante né porque por exemplo vamos supor que as ações da Google dispararam hoje né então alguém colocou essa informação as ações da Google dispararam e aí o que que acontece se o cara é um acionista da Google ele tem ações da Google para ele é um sentimento positivo Olha legal adiciona então ganha dinheiro né já que
eles pararam mas se eu vendia nas minhas ações eu tinha as ações a Google vem de ontem e hoje ela disparou então o sentimento também é negativo porque eu perdi dinheiro né então só para dar um exemplo né e a afirmação é a mesma né também importante saber né o momento em que é dito nessa variedade temporal né que a gente estava falando lá no início né então por exemplo a tela desse celular é grande hoje o sentimento até positivo mas antigamente a tela grande era ruim porque era grande demais né pessoal tava sempre querendo
diminuir hoje em dia já é um sentimento Positivo né e aqui tem um desenho interessante para vocês verem né o cara que tá feliz que tá chegando um barco e o outro que tá vendo a terra né são pessoas diferentes que estão aí em pontos de vista diferentes também né tentando formalizar um pouco mais né O que que seria uma opinião a gente pode ter ter uma definição aqui de novo no livro 2012 né que define opinião como sendo uma dupla de tamanho M de tamanho 5 ou seja uma quíntupla né que seria uma quinta
composta por uma entidade um aspecto ou atributo sentimento emissor e tempo então é uma forma de quantificar aí né de representar uma opinião né Então aqui tem um texto que fala né que eu comprei um iPhone alguns dias atrás e é um ótimo telefone a tela touch screen dele ele é muito legal e etc né então aqui a gente teria diferentes formas de duas duplas duas Quintas para representar né uma seria com a entidade iPhone um aspecto de forma geral vamos dizer assim é uma variação positiva porque tá falando bem né contando que o que
a gente tá falando aqui do iPhone né aqui quem Mentiu né O sentimento é positivo né o emissor aqui a gente está Abc 123 é só fictício né mas é como se fosse o identificador quem tá fazendo quem tá emitindo opinião e o tempo aqui seria a data né Outra quíntupla possível a gente tem vez de estar falando de uma forma geral tá falando de um atributo específico que é o que a tela touch screen desse iPhone né que seria também sentimento positivo e assim por diante então várias esse mesmo texto poderia ser tem mais
de uma opinião sendo representada ali então a gente pode representar todas essas opiniões em diferentes quíntuplas né Então a gente tem aqui uma forma que a gente tem para fazer uma uma extração de Formação né análise semântica né e aqui a gente tem como que a gente pode fazer essas análise semânticas né com reconhecimento de entidades nomeadas resolução de com referências identificação normalização temporal e assim por diante tá mas estudo não é sempre trivial né Tem alguns exemplos aqui que a gente tá vendo É como que seria alguns casos que a gente tem aqui o
banco do carro está feio o aspecto Qual é banco ou aparência do banco por exemplo né Essa câmera é cara qual seria o aspecto câmera ou o preço né então a aspectos que estão implícitos né E nem sempre há um substantivo como é o caso aqui eu posso instalar esse software facilmente o aspecto seria que a instalação mas a palavra instalação ela tá implícita ali não há não tem o substantivo né então isso também é algumas dificuldades mas sempre trivial né sair daquele nosso texto e chegar nessa representação que eu falei para vocês né dessa
quinto né aqui também eu queria mostrar para vocês o exemplo de um sistema né então aqui a gente tem esse bote vocês dá uma olhada depois tá aqui é talvez não sei se vocês vão conseguir ver com muita clareza no vídeo mas depois vocês abrindo o pdf vocês vão conseguir ver melhor essas figuras que estão aqui mas esse site aqui ele tem um exemplo de de que a gente pode utilizar um sisteminha lá para saber como é que está a opinião como na sua opinião das pessoas em relação a um determinado tópico eu coloquei ali
fiz uma busca por Donald trump né só para ver o que que tá acontecendo né é uma busca aleatória sem nenhum intuito político né E aí Isso aqui se eu não me engano eu fiz no dia 26 de agosto por isso que aqui vai até o dia 25 então a opinião aqui seria uma tendência né lá do desde o dia 18 do mês anterior até o dia 25 do mês atual né e aqui tem o que vai acontecer né o sentimento positivo a variação de sentimento positivo neutro e negativo né o total que a gente
tem aqui né então a gente vê que toda a variação que vai ter durante esse tempo né E até que chegou aqui nesse ponto a avaliação negativa tá aqui nesses últimos dias da Positiva tá mais um pouco embaixo Mas nesse dia 26 que eu fiz a consulta aqui o neutro tava com 50% negativo com 50%. e positiva zero por cento né esse aí o sentimento atual né No dia que eu fiz a consulta a gente consegue fazer uma busca dos Sentimentos tanto no momento atual como a tendência durante um período né do momento atual para
trás né então depois vocês deem uma olhada faça algumas buscas né teve alguns tops que eu tentei fazer busca e não consegui né porque às vezes são tópicos que não estão sendo falado tanto agora né atualmente mas mas é importante vocês fazerem esse teste para ver o que que tá que que dá de resultado tá outro exemplo de sistema foi proposto nesse paper aqui em 2005 né que é um observador de opinião vamos dizer assim né basicamente isso aqui é uma das possíveis saídas né que se tem nesse sistema de proposto nesse paper né que
aqui tem a opinião das pessoas em relação a dois produtos que seria duas câmeras digitais né câmera digital 1 e 2 então em relação a esses dois produtos a opinião das pessoas né o sentimento né dessas pessoas em considerando diferentes aspectos desses produtos né então por exemplo essa câmera em relação à qualidade da figura a qualidade da bateria aos 1 ao tamanho ao peso né E a gente vai vendo aqui né opinião né variando de negativa até positiva e o que que a gente tem de opinião das pessoas em relação a essas duas câmeras né
em azulzinho pra câmera um em roxo aqui pra câmera dois né então a gente olhando assim é com certeza a gente ia preferir a câmera né porque tem muito mais feedback positivo aí do que a câmera dois que tem muito feedback negativo né outra conceito importante seria as emoções né pessoal pô emoção a gente sabe que é um conceito muito amplo né uma basicamente tradicionalmente a gente trabalha com seis emoções né universalmente que a gente tem aí para que são diferenciadas pelas Faces né que seria a raiva ou medo o nojo ou aversão né tristeza
felicidade e surpresa mas a outras outras também ser investigadas outras emoções como desprezo interesse embaraço orgulho a gente vai ver que tem o trabalho que propõe até muito mais do que essas emoções eu coloquei que esse link para vocês é para sugerir para vocês dar uma olhada não sei se vocês já viram o filme divertidamente a gente pensa que é um filme para criança mas não é não né é um filme muito bom sujeira que vocês assistam que vocês vão aprender bastante com esse filme né basicamente é isso né eles têm cinco personagens aqui que
fica dentro da cabeça de uma criança e cada uma delas cada um deles representa uma uma das emoções né não tem todas as sextas tem só cinco tá aqui só para mostrar para vocês um tema porque é um tema polêmico a gente tem aqui que as emoções básicas de acordo com diferentes autores né são um conjunto é diferente maior né chegou um aqui que chega a definir 22 emoções né como sendo básicas né então aqui só para mostrar para vocês a diferença entre culpa e vergonha né já para mostrar que é um tema polêmico também
tem alguns Alguns sentimentos que ficam difíceis até de diferenciar né E aqui alguns exemplos de aplicação Então pessoal de análise sentimentos como monitoramento de mídias sociais análise feedback de clientes gestão de reputação da marca mineração de opinião e notícias detecção de emoções em chatbots e assistente virtuais tudo isso a gente vê bastante aí atualmente né e as técnicas que são utilizadas né para fazer esse tipo de análise né regras aprendizagem de máquina bastante como a gente já viu durante todo por isso que a gente teve uma semana dedicada só para aprendizado de máquina porque é
o que mais se utiliza nessa área né para várias etapas que a gente tem de processamento de linguagem natural como um todo métodos híbridos né que combina tudo isso e o mais atual que a gente tem aqui que é o aprendizado profundo que é justamente que a gente vai de novo aprender na nossa próxima aula prática tá bom então nessa vídeo aula hoje a gente falou um pouquinho sobre introdução o processamento análise sentimentos falamos sobre opiniões emoções e sobre diferentes aplicações né próxima vídeo aula então nossa última vídeo aula do curso vai falar vai ser
uma aula prática de novo sobre análise sentimentos só que agora considerando outras ferramentas em outros conjuntos de dados né e com um pouco mais detalhe sobre com foco um pouco maior não na parte de classificação Mas não foi o foco maior na classificação de sentimentos mesmo né Então até a nossa próxima pessoal [Música] [Música]