24 de fevereiro de 2018

Criatividade aumentada

Na semana passada definiu-se inteligência aumentada como uma visão da computação na qual os computadores são sistemas interativos em que os humanos se podem apoiar para expandir o seu próprio processo de resolução de problemas. Apresentou-se igualmente o paradigma de computação em oposição à inteligência artificial (IA) que se concentra em tornar as máquinas o mais autónomas possível, sendo muitas vezes apresentadas como alternativas ao desempenho de seres humanos. Descreveu-se, ainda, sucintamente o novo paradigma que faz a síntese entre a Inteligência Aumentada e a Inteligência Artificial, a que se chamou Inteligência Artificial Aumentada (AIA - Artificial Intelligence Augmentation): o uso de sistemas de Inteligência Artificial para ajudar a desenvolver novos métodos de Inteligência Aumentada. Uma das ferramentas desta nova área são os modelos generativos baseados em redes neuronais. Além dos modelos generativos existem alguns exemplos interessantes que não se baseiam neste tipo de modelos. O sistema pix2pix desenvolvido por Isola et al.(2017) é treinado em pares de imagens, por exemplo, pares que mostram um gato delineado e uma fotografia do gato correspondente. Esta aplicação utiliza uma rede neuronal que, uma vez treinada, pode ser utilizada num conjunto de objetos delineados pedindo-se ao sistema para gerar uma imagem do gato que se ajuste a essas linhas. Na maioria das vezes, o sistema faz isso na perfeição. No entanto, quando se introduzem esboços de objetos menos habituais os resultados podem ser bastante estranhos (ver a ilustração). Se se quer melhorar as capacidades cognitivas do ser humano, então a criatividade tem de ser ampliada com o auxílio das máquinas. Os modelos generativos são úteis para uma forma de criatividade que combina conhecimento anterior em algo novo. Outras formas de criatividade mais disruptivas, são a criação de novos estilos, como fizeram Picasso e Monet nas artes gráficas. A aplicação anterior abre uma área promissora para esta segunda forma de criatividade. Claro que não cria criatividade ao nível de um Picasso, mas ainda assim é surpreendente. É certamente diferente das imagens que a maioria de nós já viu antes. Como é que o pix2pix e o seu utilizador humano conseguem esse tipo de resultados? Ao contrário do exemplo descrito na semana passada, o pix2pix não usa um modelo generativo. Isso significa que não possui espaço latente ou espaço correspondente para imagens naturais. Em vez disso, usa uma rede neuronal com o nome degerador. Apesar do nome, estas redes neuronais não fazem o mesmo que os modelos generativos anteriores. As redes geradoras são treinadas de forma concorrencial contra uma rede discriminante, cujo trabalho é distinguir entre pares de imagens geradas a partir de dados reais e as imagens geradas pelo gerador. Embora isso pareça semelhante a um modelo gerador convencional, há uma diferença crucial: não são introduzidos vetores latentes. Em vez disso, existe simplesmente uma restrição de entrada. Quando se insere uma restrição diferente de qualquer coisa observada no treino, a rede é forçada a improvisar, fazendo o melhor que pode para interpretar essa restrição de acordo com as regras que aprendeu anteriormente. A criatividade é o resultado de uma fusão forçada de conhecimento deduzida dos dados de treino, juntamente com novas restrições fornecidas pelo humano. Como resultado, mesmo as ideias relativamente simples - como o gato e a forma de um pão - podem resultar em novos tipos surpreendentes de imagens, imagens fora do que anteriormente teríamos considerado o espaço das imagens naturais. É do conhecimento comum que a Inteligência Artificial irá mudar a maneira como interagimos com os computadores. Infelizmente, muitos nesta comunidade subestimam o design da interface, muitas vezes considerando-o como um problema simples, principalmente baseadona estética e na facilidade de uso. Assim, o design da interface pode ser entregue a outros enquanto o trabalho árduoconsiste em treinar algoritmos de aprendizagem. Essa visão é incorreta. No sentido mais profundo, o design da interface significa desenvolver as bases fundamentais para que os seres humanos possam pensar e criar. Este é um problema cuja génese intelectual remonta aos inventores do alfabeto, da cartografia e da notação musical, bem como a gigantes modernos como Descartes, Playfair, Feynman, Engelbart e Kay. É um dos problemas mais difíceis, importantes e fundamentais que a humanidade enfrenta. Conforme discutido na semana passada, na visão da Inteligência Artificial, os computadores continuarão a melhorar a resolução de problemas, mas os seres humanos permanecerão praticamente inalterados. Ou, numa segunda visão igualmente comum, os seres humanos serão modificados no nível de hardware, talvez diretamente através de interfaces neuronais com implantes, ou indiretamente através de emulação da totalidade do cérebro. Neste texto descreve-se uma terceira visão, na qual os sistemas realmente mudam a humanidade, ajudando a inventar novas tecnologias cognitivas, que expandem o alcance do pensamento humano. Talvez um dia essas tecnologias cognitivas, por sua vez, acelerem o desenvolvimento da Inteligência Artificial, num ciclo de feedback virtuoso: melhores sistemas de Inteligência Artificial conduzem a tecnologias cognitivas mais poderosas, que por sua vez após internalização como conhecimento e capacidade de raciocínio possam conduzir a melhores formas de pensamento humano. Estas, por sua vez, podem ajudar a desenvolver novas formas de IA, obtendo-se um ciclo de melhoria contínua. Não seria uma singularidade das máquinas, em vez disso, seria uma singularidade na capacidade de raciocínio humano. Claro que este ciclo é extremamente especulativo para já. Os sistemas que descrevemos podem ajudar a desenvolver formas mais poderosas de pensar, mas até agora, apenas de forma indireta. É claro que, a longo prazo, é possível que as máquinas excedam os seres humanos em algumas ou mesmo todas as tarefas cognitivas. Mesmo que seja esse o caso, a transformação cognitiva ainda será um objetivo válido. Há prazer e valor envolvidos em aprender a jogar xadrez ou Go, mesmo que as máquinas o façam melhor. Em atividades como a narração de estórias, o benefício muitas vezes não é tanto o objeto produzido, mas o processo de construção propriamente dito, e as relações criadas. Existe um valor intrínseco na mudança pessoal e no crescimento, para além dos benefícios instrumentais. O trabalho orientado para a interface, que se apresentou, está fora da narrativa usada para julgar a maioria dos trabalhos existentes em Inteligência Artificial. Não implica obter um ponto de referência para um problema de classificação ou regressão, como é o caso frequentemente na área da AI. Não envolve feitos impressionantes como vencer campeões humanos em jogos como Go. Em vez disso, implica um critério muito mais subjetivo e difícil de medir: será que melhora o conhecimento humano e a criatividade? Este objetivo cria dificuldades, particularmente para quem pretende fazer investigação na área. Onde deve, este tipo de trabalho, ser publicado? A que comunidade pertence? Que padrões devem ser aplicados para avaliar este tipo de trabalho? O que distingue um bom de um mau trabalho? Acredita-se que, nos próximos anos, surgirá uma comunidade com capacidade para responder a estas questões. Surgirão workshops e conferências. Os padrões surgirão de muitas comunidades diferentes: das comunidades artísticas, de design e musicais; do gosto da comunidade matemática pela abstração e definições; bem como das comunidades existentes de Inteligência Aumentada e Inteligência Artificial, incluindo o trabalho de criatividade computacional e interação humano-computador. O teste de sucesso a longo prazo será o desenvolvimento de ferramentas amplamente utilizadas pelos criadores. Os artistas usam essas ferramentas para desenvolver novos estilos? Os cientistas de outros campos estão a usá-las para desenvolver a compreensão de fenómenos não antes explicados? Estas são ótimas aspirações, exigem uma abordagem que se baseie no trabalho da Inteligência Artificial convencional, mas também incorpora normas muito diferentes. Baseado nos seguintes textos: Shan Carter, Michael Nielsen (Google Brain Team), “Using Artificial Intelligence to Augment Human Intelligence”, publicado a 4 de dezembro de 2017, https://distill.pub/ Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efros “mage-to-Image Translation with Conditional Adversarial Networks”, 22 novembro 2017.
Print

Categorias: Regional

Tags:

Theme picker

Revista Pub açorianissima