MELLO M. (2003). Reflexões sobre Lingüística e  cognição musical. Tese (Mestrado); Campinas: Instituto de Estudos da Linguagem, Universidade Estadual de Campinas.

Voltar para índice.

Voltar para http://www.marcelomelloweb.cjb.net.

 

 

V. COGNIÇÃO MUSICAL E SISTEMAS COMPUTACIONAIS

“With or without music cognition, music theory had always addressed the question of how humans experience music. When building computer programs to emulate aspects of musical skills, we do well to profit from the guidance that tradition can lend.”130

ROWE, Interactive Music Systems.

Uma das maiores tradições filosóficas consideráveis como “epistemológicas” talvez seja a de identificar a racionalidade humana com uma lógica eminentemente axiomizável, ou matemática. A leis da razão (e neste caso também as leis do cogito cartesiano - ver Capítulo II) são as leis do formalismo lógico, ou, ao menos, não pode haver contradição entre estas duas “categorias”; a percepção do mundo real, denotativo ou “cognitivo” (digamos, “sígnico” - ver Capítulo IV) é dada como possível apenas em sua possibilidade material, física, descrita em um código formalizado (em uma linguagem, em uma “lógica”); finalmente, o próprio objeto científico (tanto em sua faceta idealizada, invariável, quanto material, evidente) pode mesmo ser identificado com a noção de algoritmo, ou de operação linear e mecânica (automática).

“The concept of an ‘algorithm’ can be called upon to explicate the notion of a ‘precise description’ of a phenomenon. This notion is especially important in the domain of scientific research, where it calls for a representation as precise as possible of the domain under study”131 (SEIFERT 1992). “If our consciousness thinking involves nonalgorithmic physical action, there would be scope for nonalgorithmic behaviour in physical laws”132 (PENROSE 1988).

A questão se insere de fato na temática filosófica da relação entre linguagem e lógica, especialmente para os que pensam no funcionamento da linguagem, ou nos objetos de estudo lingüístico. Não apenas a referencialidade lingüística (semântica), imbuível de valor de verdade, parece pertinente à relação entre linguagem e lógica, mas também a forma combinatória, serial (em suma, sintática), na qual ela se dá. Assim, a forma da enunciação denotativa e verdadeira (ou seja, de uma enunciação lógica) deveria não só corresponder a valores de verdade empíricos, mas também a uma forma de concatenação adequada e necessária. Uma “transformação sistemática de valores-de-verdade” operada pela lógica (SCRUTON 1982) não é apenas uma operação racional, mas é sobretudo formalizada, obtível através de procedimentos também por si mesmos mecânicos (impessoais) e rigorosos (restritivos) encontráveis no funcionamento da linguagem (em qualquer funcionamento da linguagem); a lógica não parece depender apenas de sua referência enquanto processo sígnico, mas também de sua sintaxe, ou de sua gramática. Assim, a lógica (e sua relação com a linguagem) parece dever uma correspondência não apenas a uma necessidade empírica, “real” ou simplesmente física (como no caso da referência semântica) mas também a uma ordem racional, ideal, humana (como no formalismo sintático).

Ora, se a valorização do código de informação (ou informacional) é uma das conseqüências principais da postulação da máquina de TURING (1936), como já foi apresentado no Capítulo II, tal valorização pode alcançar uma singular relevância epistemológica (TURING 1950). Na medida em que o próprio comportamento humano é racional, ele pode (ou deve) ser representável por meio de formulações lógicas (ou simplesmente lingüísticas), ou seja, ele pode (ou deve) ser simulável por meios que reproduzam tais formulações, seja a própria sentença formal, seja sua realização em um processo automático, ou uma máquina - seja a máquina de Turing abstrata, seja sua materialidade, ou o computador.

“It is clear that at least some human mental abilities are algorithmic. For example, I can consciously do long division by going through the steps of an algorithm for solving long division problems. […] In such a case, as described by TURING (l950), both I, the human computer, and the mechanical computer are implementing the same algorithm, I am doing it consciously, the mechanical computer nonconsciously. Now it seems reasonable to suppose there might also be a whole lot of mental processes going on in my brain nonconsciously which are also computational. And if so, we could find out how the brain works by simulating these very processes on a digital computer. Just as we got a computer simulation of the processes for doing long division, so we could get a computer simulation of the processs for understanding language, visual perception, categorization, etc.“133 (SEARLE 1990).

É dessa forma que uma discussão propriamente sígnica da possibilidade de representações mentais ou cognitivas, como vista no Capítulo IV, passa a ser uma discussão sobre sua possibilidade formal (ou material). Para além do simples funcionamento do signo, uma teoria cognitivista da mente pode ser apresentada como uma teoria psicológica (internalista, de estados mentais internos) sobre a possibilidade do pensamento racional, da maneira como o faz um dos mais importantes teóricos da chamadas ciências cognitivas, o filósofo Jerry FODOR (1975; FODOR 1982; FODOR 1987; FODOR 1994; FODOR 1998).

“I want a mechanism for the relation between organisms and propositions, and the only one I can think of is mediation by internal representation”134 (FODOR 1982; grifo do autor). "The basic question in cognitive science is, How could a mechanism be rational? The serious answer to that question is […] that it could be rational by being a sort of proof-theoretic device, that is, by being a mechanism that has representational capacities - mental states that represent states of the world - and that can operate on these mental states by virtue of its syntactical properties. The basic idea in cognitive science is the idea of proof theory, that is, that you can simulate semantic relations - in particular, semantic relations among thoughts - by syntactical processes"135 (FODOR apud ZAWIDZKI 2002).

O modelo modularista de Fodor (já comentado no Capítulo II) faz menção ao processamento cognitivo superior (à inter-relação mental ou cognitiva superior entre os módulos cerebrais) funcionando como um sistema formal de comunicação (de codificação), isto é, como uma linguagem. Esta noção aproximaria muito do que Fodor diz com a teoria da Gramática Gerativa Universal de Chomsky (de uma “estrutura profunda” lógica, de caráter eminentemente sintático, entranhada em todo funcionamento da linguagem verbal). De fato, Fodor ocupou-se durante um considerável período de tempo com teorias gerativas durante sua carreira acadêmica (por exemplo KATZ, FODOR 1964; BEVER, FODOR, WEKSEL 1965).

“It is clear, as KATZ, FODOR (1964) have emphasized, that the meaning of a sentence is based on the meaning of its elementary parts and that manner of their combination. It is also clear that the manner of combination provided by the surface (immediate constituent) structure is in general almost totally irrelevant to semantic interpretation, whereas the grammatical relations expressed in the abstract deep structures are, in many cases, just those that determine the meaning of the sentence”136 (CHOMSKY 1965). “Like the Katz and Fodor theory, some kind of dictionary would be required, but in the musical case it should be incomplete before a hearing of a composition. It would then be filled by representations of motives that belong to the piece as it runs its course”137 (SLAWSON 1991).

O “código informacional” dos mecanismos cerebrais e nervosos adquire significado na medida em que corresponde ao próprio funcionamento do “módulo” nervoso-cerebral, biologicamente dado, independente e irredutível. É o resultado do processamento modular (o código ou representação no impulso cerebral) que adquire valor ontológico, ou digamos “semiótico”, de uma “primeiridade” peirceana. Não é por acaso que Fodor (e outros autores comprometidos com um formalismo algorítmico dos processos cognitivos) cita princípios de psicologia da Gestalt como condizentes com sua teoria. A atribuição de formas anteriores e inatas aos estímulos externos seria afinal o próprio funcionamento da cognição mecânico, automático, de princípios inatos, apontáveis também na postulação de uma racionalidade humana invariável e universal.

“[…] Behaviorally salient properties of the stimulus are a selection from the properties that belong to it: of all the indefinitely many properties the stimulus does have, only those can be behaviorally salient which the organism represents the stimulus as having”138 (FODOR 1975; grifos do autor). “Perhaps the most significant general result of the school of Gestalt psychology […] was its demonstration of the extent on which perception is the result of an interaction between environmental input and active principles in the mind that impose structure on that input”139 (JACKENDOFF 1983).

Ao mesmo tempo, tal código informacional não tem valor especificamente “sintático” (lingüístico) para além das representações modulares, e nem “semântico” (sígnico) para além dos módulos cognitivos, podendo ser melhor descrito como uma “semântica combinatorial” (FODOR 1987). É a partir deste ponto que uma teoria psicológica materialista a respeito da mente pode inter-relacionar (e ultrapassar) as distinções entre semântica e sintaxe (ou entre signo e estrutura - ver Capítulo IV), prescrevendo uma intermediação especificamente computacional (codificada, formal, interna e irredutível) entre os processos cognitivos (biológicos ou simplesmente nervosos) e as funções mentais superiores. Não teríamos acesso consciente (ou representacional) às formas do mundo, apenas à sua “extração” constituída computacionalmente pelos sentidos corporais (ou melhor, pelos módulos cognitivos). A forma nuclear desta extração é primordial e irredutível, ou, em outros termos, “denotativa”, correspondente a uma inferência no mundo de ordem material, biológica e necessária; ao menos em algum nível processual (e lingüístico), deveria haver uma correspondência causal entre a representação e o objeto representado, que indique como, por exemplo, a representação de “cachorro” (o exemplo favorito de Fodor) equivalha a seu nome, e não a um conjunto de outras representações (“quatro patas”, “animal”, “mamífero” etc.).

“Once it is accepted that in order to acquire a concept, one must be able to represent the reducing concepts in a hypothesis, and given that much thought is linguistic, and specifically, that most or all concepts can be expressed in linguistic thought, it follows that a language with predicates whose meanings are the ultimate reducing concepts is required in order to acquire other concepts. (If DOG really did reduce to NORMALLY FOUR-LEGGED, FURRY, TAILED, BARKS, and those in turn are primitive, we'd need a language with predicates expressing those concepts). That is to say, there must be an innate language of thought with predicates that express the primitive concepts. Since spoken languages are not innate, it follows that each language learner must have a language of though distinct from all spoken languages”140 (KAYE 1998; grifo do autor).

Enquanto base computacional das atividades cognitivas superiores, as combinações sintáticas do código dos módulos cognitivos, biologicamente dado, seriam constitutivas não apenas de todas as línguas naturais (identificando-se nesta parte com a Gramática Universal de Chomsky), mas também do pensamento racional, ou melhor, proposicional. A intermediação informacional cria então uma nova instância psicológica nas qual as representações funcionam, independentemente dos módulos cognitivos que lhe dão forma. Em termos mais simples, é apenas a existência de um código anterior (nesse caso, de ordem biológica) que permite a possibilidade de representação.

“I will argue, primarily, that you cannot learn a language whose terms express semantic properties not expressed by the terms of some language you are already able to use”141 (FODOR 1975).

É o surgimento da noção de “mente computacional” (JACKENDOFF 1987), que pode indicar neste caso tanto uma ponte natural quanto uma ruptura específica entre os procedimentos racionais e seu substrato meramente biológico. Os “dados dos sentidos” da tradição filosófica (cf. AUSTIN 1983) seriam fontes de “informação periférica” (“peripheral information”) para um “centro” cognitivo não só responsável pela racionalidade, mas também dotado de eminentes características categorizantes, sígnicas ou simplesmente semânticas (JACKENDOFF 1983). O desdobramento das instâncias através das quais se constituem os processos cognitivos leva a uma separação entre a consciência e a racionalidade, ou, em outros termos, entre a mente “fenomenológica” e a mente “computacional” (Figura 13).

“The upshot is that psychology now has not two domains to worry about, brain and mind, but three: the brain, the computational mind and the phenomenological mind. Consequently, Descartes’ formulation to the mind-body problem is split into two separate issues. The ‘phenomenological mind-body problem’ […] is, How can a brain have experiences? The ‘computational mind-body problem’ is, How can a brain accomplish reasoning? In addition, we have the mind-mind problem, namely, what is the relation between computational states and experience?”142 (JACKENDOFF 1987).

 

Figura 13 - Representação da noção de mente computacional dentro de uma teoria psicológica (JACKENDOFF 1987).

 

Inteligência artificial e cognição musical

De acordo com Jackendoff, as formulações características da Teoria Gerativa da Música Tonal, apresentada no Capítulo IV, são atuantes ao nível da mente “computacional”, do processamento cognitivo (categorizante, computacional) em música, o que autorizaria seu status de universalidade e conceitualidade do objeto musical. Nesse caso, uma crítica às suas postulações no terreno musical pode ser colocada não nas conseqüências epistemológicas de uma “mente computacional” em música, mas nas exigências que uma visão propriamente algorítmica dos processos cognitivos impõe a um modelo baseado em regras de “boa formação” de caráter menos inflexível e automático (como no modelo de Lerdahl & Jackendoff).

“Lerdahl and Jackendoff’s theory of musical structure is without doubt not a formal theory which could be formulated algorithmically. The problem to develop a precise formal theory of musical structure and processing, which is at the basis of the cognitive modelling of music perception […], exists until today”143 (SEIFERT 1992).

Na verdade, a relação entre música e matemática remonta a antiqüíssimas tradições que remetem a um logos de caráter combinatório imbuído tanto de música quanto de números. As relações algorítmicas presentes nos fenômenos sonoros já são conhecidas desde há muito; na Grécia antiga, Pitágoras não só sabia das relações de simetria presentes nos intervalos de altura (de freqüência sonora) e nas estruturas timbrísticas (da série harmônica), como as usava como parte da formação de uma complexa cosmogonia, baseada na matemática. Durante o desenvolvimento da história ocidental, há vários exemplos de concepções matemáticas, lógicas ou combinatórias do musical, em terrenos inclusive diversos dos simplesmente acústicos - estéticos, de simetria entre partes; simbólicos, de correspondência a um ideal metafísico; formais, de estrutura do discurso musical etc. Para além (ou talvez num sentido mais particular que) de uma identificação “natural” entre música e matemática, talvez seja oportuno indicar enfim uma possível manifestação nova da metáfora musical, aproximando produtos musicais específicos de uma universalidade acústica, física ou “cósmica”.

“Guido d’Arezzo (s. XI) já se utilizava de recursos algorítmicos para compor música [...]; no século XIII, o compositor Philipp de Vitry usou a repetição cíclica de padrões rítmicos para construir tenores de motetes” (MANZOLLI 1995). “The concept of computation in music has radically changed at the end of the Renaissance era, when it moved from the mathematical understanding of immanent laws of consonance to the (Leibnizian) idea of a musical world generated through combinatorial rules”144 (ASSAYAG 2001). “The collections of pitches that are used in tonal music - scales, modes, chords and keys - when considered in mathematical terms within computational representations have been shown to exhibit some extraordinary properties that suit them excellently for use in the outlining of pattern in time (BALZANO 1980; BROWNE 1981)”145 (CROSS 1999A).

É dessa maneira que diversas correntes de pesquisa sobre processamento musical dedicam-se a elaborar e testar computacionalmente modelos algorítmicos de percepção e manipulação hierárquica de signos musicais, podendo ser identificadas então com o ideal metodológico da inteligência artificial, tal como já fora retratada no Capítulo II. Os objetos e processos musicais são apresentados, de vários modos possíveis, como uma série de elementos discretos (“dados”) dispostos e armazenados de maneira linear, formalizada, e manipulados ou inter-relacionados segundo regras explícitas. Para isso, é necessária em primeiro lugar alguma forma de representação prévia do dado musical (ou simplesmente sonoro), quer ao nível de sua tradução (ou transdução) perceptual na produção ou na percepção de música, quer na identificação formal de padrões combinatórios nos dados, na delimitação de objetos primários (notas, ritmos etc.). É assim que um modelo algoritmicamente formalizado dos fenômenos musicais é amplamente identificado com uma metodologia lingüística, ou mais especificamente com uma “gramática” dos signos musicais, tornando o substrato conceitual de uma inteligência artificial (em seu sentido forte, identificada com resultados de programas de computadores - cf. SEARLE 1990) aplicada à música, como uma continuação natural de um modelo lingüístico para os objetos musicais, tal como fora apresentado no Capítulo IV; nesse caso, vários dos modelos possíveis de categorização de signos musicais também envolvem modelos algorítmicos ou simplesmente computacionais (SUNDBERG, LINDBLOM 1976; CAMILLERI, CARRERAS, DURANTI 1990, sobre TENNEY, POLANSKY 1980; etc.).

“Two strands in existing musical modelling can be distinguished […]. The first is an algorithmic, ‘information processing’ approach […]; A model is giving some input and produces some output: the degree of which this matches the output of a listener (or performer, or whoever) constitutes the criterion of its success. […] The second strand […] is predicated on linguistic concepts, making explicit the notion of musical ‘language’ and aiming to formulate grammars of such languages”146 (MARSDEN, POPLE 1989). “The acoustic signal, as perceived by the listener, may be regarded as a ‘lowest-level language’ representation of musical information. A representation in terms of which notes are played by which instruments, that is, a decomposition of this information into partbooks, may be said to constitute a ‘machine language’ representation of the information, given that we may provide the definition of the appropriate ‘machine’ (i.e. music processor)”147 (SMOLIAR 1980).

Há então uma vultuosa profusão de “programas de computador que pensam música” na literatura relevante, que sempre envolvem de alguma forma evidências cognitivas. Certamente que tal definição oferece pouca especificidade inicial às possibilidades de uma inteligência artificial (computacional) em Música, e assim, é bastante grande a variedade de possíveis caminhos distintos para pesquisa (cf. HÖRNEL ET ALL S.D.). Mas será factível e vantajoso apontar para similaridades e crenças comuns em grande parte da produção contemporânea, dentro da qual pode-se selecionar exemplos representativos (WINOGRAD 1968; SMOLIAR 1974; SMOLIAR 1980; LONGUET-HIGGINS 1987; MARSDEN, POPLE 1989; CAMILLERI, CARRERAS, DURANTI 1990; ROWE 1993; MARSDEN 1998; etc.). Programas de pesquisa como estes, grosso modo, podem ser descritos como procedimentos automáticos de análise e/ou produção de obras musicais, a partir de regras explícitas. Nesse caso, as regras de categorização dos objetos sonoros se confundem com as próprias propriedades de segmentação do material sonoro, apresentadas de acordo com esquemas recursivos e transformacionais nos moldes da tradição lingüística chomskyana (principalmente fonológica). É assim que a inteligência artificial musical apresenta múltiplas possibilidades de representação do objeto musical usada como dado de entrada para análise, desde sua materialidade sonora, acústica, até uma simples “emulação” do conteúdo simbólico das partituras tradicionais em termos de linguagem de computador. O algoritmo musical pode se confundir não só com uma “gramática” dos elementos musicais (tomada na maior parte das vezes como um processo invariável, necessário e universal), mas com todas as conseqüências de uma postulação necessária e invariável para os fenômenos lingüísticos, mentais ou simplesmente cognitivos. Apesar de em vários momentos serem distinguidas diferenças como a entre escuta e composição musicais, a atividade musical, nas múltiplas categorias modais inerentes aos fenômenos sonoros (ritmo, harmonia, seqüências melódicas etc.), é tratada como um processo de inferência de categorias sonoras, representável por diversos exemplos de fluxogramas, ou de diagramas de processamento mental ou simplesmente racional, implementáveis como programas informatizados (Figura 14).

É claro, uma abordagem computacional não torna natural, por si só, o envolvimento de postulações lingüísticas ou mesmo uma interdisciplinaridade entre música e Lingüística (afinal, a metáfora musical), e assim podem ser contraditórios e por vezes antagônicos os motivos e conclusões
nesse sentido, em um campo que deveria se supor delimitado e coerente internamente, dada sua concepção e sua metodologia científicas.

“[…] as the great body of scholarship on music theory shows, there is a set of quite specific structural (syntactic) rules governing most types of music, and a generative grammar would provide a neat and useful way of expressing them”148 (WINOGRAD 1968). “We must say that music is no more similar to language than any other object in the world, and the only valid relations we can expect to find are those of contiguity149 (DYDO 1983; grifo do autor).

 

A)

B)

C)               

Figura 14 - exemplos de “fluxogramas” de programas computacionais que representam atividades cognitivas em música: A) diagrama de processamento do programa de extração de padrões de uma partitura musical, o LIMID: “A representação computacional da partitura é lida sucessivamente por diferentes partes do programa no processo de estabelecimento de relações internas, e de relações com informação codificada previamente em tabelas” (DYDO 1983); B) diagrama de uma “estrutura de controle” do processo de escuta musical, baseado em programas de reconhecimento de fala (SOK= “source of knowledge”, “fonte de conhecimento”): “unidades alinhadas horizontalmente conectadas por flechas funcionam essencialmente como co-rotinas. Unidades na mesma linha horizontal não conectadas funcionam como processos paralelos. [...] Finalmente, as flechas verticais indicam a ‘propagação da informação’ por todo o sistema” (SMOLIAR 1980); C) diagrama indicando relações entre o representante computacional do “ouvinte” e o do “executante”, no banco de dados do programa CYPHER (ROWE 1993).

 

Para além de uma mera condição formal ou algorítmica geral para o processamento musical, a noção de regra pode, em vários exemplos relevantes (YAKO 1997; CHOUVEL 1993; DESAIN, HONING 1999; etc.) ultrapassar uma função auxiliar dentro de uma cognição “computacional” em música, e se firmar como constituinte elementar da própria ontologia musical; em outras palavras, dentro de sistemas como estes, as regras computacionais podem ser não apenas uma “maneira” de processamento cognitivo dos fenômenos musicais, mas sim sua própria razão de existência. O caráter hierárquico dos processos cognitivos (em grande parte, identificados com princípios da percepção auditiva) criaria “instâncias” em cujo cerne estaria o funcionamento de uma proposição coercitiva (uma regra). Cada instância define por sua vez uma “ambientação” não meramente formal, mas de constituição do fenômeno musical; este poderia, portanto, ser descrito como uma cadeia hierárquica de “presentes” temporais e sonoros (da nota, do ritmo, da função harmônica, da estrutura melódica etc.), de momentos passíveis de investigação racional, cada um deles definível pelo funcionamento de uma regra, de forma similar a uma “fenomenologia do tempo” dada por HUSSERL através dos conceitos de propensão e retenção (ver Capítulo II). Regras mais primitivas entram também na constituição das instâncias superiores; regras superiores na hierarquia cognitiva, por sua vez, dão origem a instâncias cada vez mais abstratas e menos dependentes de um contexto real, material; seriam inscrições de um “passado” ou uma “memória” fenomenológica (Figura 15). Dentro das práticas musicais costumeiras, o caráter cíclico da aplicação dos vários níveis hierárquicos de regras é bastante valorizado, de acordo com evidências de psicologia cognitiva (LERDAHL, JACKENDOFF 1983A; POVEL, ESSENS 1985; PALMER, KRUMHANSL 1990).

 

Figura 15 - Representação do funcionamento das diferentes “instâncias” cognitivas (S1-S4), cada uma das quais constituindo uma nova “regra cognitiva” (um “presente” ou um “espaço” musicais) e cada uma das quais contendo a instância superior (através do sinal ) (YAKO 1997).

 

“A musical work memorize past notes. This means that a work is recognized by retaining notes in the mind through perception”150. […] “Essentially, the irreversibility of time is dissolved, and a phenomenon is represented and recognized spatially […]; the higher the stratum and therefore the more knowledge-dependent the rules are, the more arbitrary they become because they are freed from perception and can be structured artificially”151 (YAKO 1997).

Assim, o funcionamento da regra dentro dos fenômenos musicais implica na noção de memória linear e cumulativa dos “presentes” temporais criados no transcorrer da música (ou do funcionamento da regra) , como principal forma conceitual de relacionamento entre a matemática musical e a cognição musical. Tal como no Capítulo IV, a tradução espacial (em termos de escrita, ou de um armazenamento linear como o da memória do computador) dos objetos temporais ocorridos na música é tomada como uma “memória”, tanto documental, quanto cognitiva, quanto especificamente computacional, implicando em diversas formas de relacionamento e de valorização destas instâncias entre si. Da mesma forma, variações dos patterns (padrões) das regras de constituição dos objetos (ou das “memórias” de presentes musicais) são tomadas como explicações cognitivas de variações estilísticas entre os diferentes gêneros e estilos em música. Em todo caso, trata-se do que pode ser descrito através de uma regra (de uma teoria musical), especialmente em termos algorítmicos ou computacionais. Ou seja, trata-se do quanto a teoria musical já oferece de lógico (ou funcional) em si mesma, em relação à constituição dos objetos musicais.

“LONGUET-HIGGINS (1987) focuses on how the way a simple melody is notated reflects the data structure we’ve already built in our mind for describing it”152 (SCHWANAUER, LEVITT 1993). “The piano roll, taken by itself, is a metaprocess, that is, a description of a process. […] Another basic example of a metaprocess is a musical score”153 (SMOLIAR 1974; grifo do autor).

O cerne e o ponto mais avançado das questões envolvidas em uma inteligência artificial em música, portanto, pode ser finalmente apontado na obra de Otto LASKE (1977; LASKE 1980; LASKE 1991). Baseando-se na obra pioneira de KUNST (1978), sobre a relação entre música e lógica (matemática ou formal), uma busca “formal” (LASKE 1980) e “epistemológica” (LASKE 1991) pela constituição cognitiva dos objetos musicais recusa um simples formalismo sígnico, de “notas” (o exemplo citado por ele é NARMOUR 1977), para desenvolver uma descrição “sonológica” do conhecimento e da compreensão musicais. Em Laske, é o próprio processo de investigação do continuum sonoro, por parte do ouvinte, que é colocado em debate científico; a escuta é apresentada como um processo de “resolução de quebra-cabeças” (“listening process as a puzzle solving”), um “caminhar em um labirinto” (“listening is a walk through a labyrinth”), onde o estado atual de processamento musical deve ser inferido através da somatória de todos os estados de inferência anteriores. É o surgimento de uma “pragmática formal” da percepção musical, funcionando através de instâncias de inferência explícitas e formais, e que vai além de uma mera oposição interdisciplinar (onde o objeto musical e o objeto lingüístico são diretamente confrontados) para propor uma “gramática gerativa” dos objetos sonoros, que toma a conceituação chomskyana como princípio geral de funcionamento cognitivo (ao menos, da categorização na percepção sonora).

“LASKE regards semantic processing as a matter of reconstruction. That is, a listener who perceives a musical event may be said to ‘understand’ that event if he is capable of specifying how it may be reproduced”154 (SMOLIAR 1980). “A musical experience, in terms of pragmatics, is the total of all current pasts a listener has constructed during a listening situation”155 […] “We suggest […] that musical processing be viewed as involving a relatively small data base formed by high-level perceptual primitives, and that it be assumed that an involved performance program is operating upon that data base. This procedural view of music-analysis problem has a methodological advantage in that one is able to shed light on the use of conceptual frameworks used in music analysis instead of treating such frameworks uncritically, as given, or viewing them ideologically”156 (LASKE 1980).

Ao que pode ser inferido de diversas fontes bibliográficas (ex. HÖRNEL ET ALL S.D., ou os títulos de artigos de periódicos como Journal of New Music Research, Interface, Computer Music Journal), formas de apropriação de sistemas computacionais mais lineares aplicadas à música - usadas para interesses variados como a análise melódica (SMOLIAR 1974; LONGUET-HIGGINS 1987; CAMILLERI, CARRERAS, DURANTI 1990) e etnológica (KIPPEN 1989), a composição (DELIO 1991) e a performance musicais, com exemplos nos mais diferentes estilos (ULRICH 1977) - parecem estar perdendo sua força conceitual dentro dos estudos do campo cognitivo, independentemente de sua adequação a modelos teóricos lógico-cognitivos como o de Lerdahl & Jackendoff. Mais do que explicar uma relação causal entre música e lógica, a inteligência artificial tradicional em música toma tal relação como necessária ou pré-concebida; mais do que fornecer bases cognitivas para a teoria musical vigente, tais linhas de pesquisa prescindem, na maior parte das vezes, de uma formulação anterior.

“Are we searching for hard facts - indeed objective truths - about music and the musical mind, or do we instead say as much about the workings of our own minds by being the interpreters of information? After all, we program our computers to do what we want them to do, and we thereby determine the nature of much of the information we require of our experiments”157 (KIPPEN 1992). “There are limitations on the serial-computer approach, for it has become increasingly evident that transduction of the early stages of perception are fundamental and massively parallel in nature. The serial computer metaphor, therefore, is gradually been dropped for the brain metaphor. The study of intelligence, then, has to be described not only in terms of ‘artificial’ intelligence, but in terms of ‘natural’ intelligence as well, and brain sciences and the neurobiological approach are guiding tools in providing an empirical basis for studying human intelligence.”158 (REYBROUCK 1989).

Ao mesmo tempo, o fundamental não seria o modo de funcionamento específico dos processos cognitivos (ou seu resultado material), mas a maneira como eles podem servir de base para postulações causais. É dessa forma que Fodor, por exemplo, também descarta completamente qualquer tipo de metodologia de “simulação” de comportamentos ou processos racionais por programas de computador. As simulações computacionais de tarefas ou atividades tipicamente humanas não podem, de acordo com ele, dizer nada sobre os mecanismos causais que originam os processos mentais. O máximo que podem fazer é demonstrar o funcionamento de sua própria lógica computacional interna, já advinda da aplicação dos princípios de engenharia tecnológica. Os produtos da racionalidade não podem ser tomados como explicação direta de suas causas; Fodor é taxativo em afirmar o “fracasso da inteligência artificial” enquanto metodologia cognitiva (BEUTKE 2001; GREEN 1996).

“The machine language [of computers] differs form the input/output language in that its formulae correspond directly to computationally relevant physical states and operations of the machine. The physics of the machine thus guarantees that the sequences of states and operations it run through in the course of its computations respect the semantic constraints on formulae in its internal language. What takes the place of a truth definition for the machine language is simply the engineering principles which guarantee this correspondence”159 (FODOR 1975). “I don't think you do the science of complex phenomena by attempting to model gross observable variance. Physics, for example, is not the attempt to construct a machine that would be indistinguishable from the real world for the length of a conversation. We do not think of Disneyland as a major scientific achievement”160 (FODOR 1991; grifo do autor).

Para além de uma simulação de caráter funcional, que repita os resultados esperáveis para fenômenos musicais (ou humanos, de uma forma geral), a proposição de uma racionalidade mecânica e automática (formal, lógica, material) para o comportamento musical deve tender a propor uma gênese teórica própria, uma anterioridade de funcionamento dos fenômenos musicais à sua representação especificamente humana ou social. No desenvolvimento histórico de vários tipos de “máquinas pensantes”, de comportamento autônomo e adaptável (e não simplesmente programas computacionais, proposições ou “instruções” lógicas), desde as “máquinas de jogar xadrez” dos séc. XVIII e XIX (embora quase sempre “engodos” científicos) até as “teorias dos autômatos” e “teorias das decisões” (desenvolvidas no séc. XX por matemáticos como Von Neumman e Ashby - DUPUY 1996), as imagens de uma mecanicidade natural do comportamento humano que se sobressaem parecem ser representáveis pela idéia de um organismo fabricado (ou um robô), de funcionamento autônomo e regulado, posto num ambiente interativo do qual pode não apenas extrair dados mas também tomar decisões e executar ações; a criação de uma “máquina de pensar” (ou de sentir) como esta dá origem por sua vez a uma “epistemologia sintética” (“synthetic epistemology” - BLANCHARD 1999). Num relevante exemplo atual voltado para problemas musicais, é dessa forma que o projeto chamado de Roboser, desenvolvido numa parceria do Núcleo Interdisciplinar de Comunicação Sonora (Universidade Estadual de Campinas - São Paulo) com o Instituto de NeuroInformática (Zurique - Suíça), pretende aplicar algoritmos computacionais simuladores de processamento sensorial como modelos composicionais de música. Um sistema robótico dotado de movimentos e livre num ambiente a ser explorado, acoplado a sensores de luz, som, “táteis” etc., utiliza o resultado de suas rotinas programadas de processamento sensorial, baseadas no funcionamento neuronal ou cerebral (e por isso identificáveis também com acepções conexionistas de funcionamento cerebral, a serem descritas neste capítulo), como geradores de entrada de dados para algoritmos de composição de trechos musicais; os diferentes dados criados pelo programa de processamento “perceptual” do robô são usados como input de processamento e produção de objetos especificamente musicais (alturas, durações, intensidades etc.). O resultado é um sistema autônomo que transforma, ou melhor, que interpreta dados do ambiente circundante em termos musicais.

“O robô, ao movimentar-se, mede a variação da luz e a proximidade de obstáculos. Na presença de intensidade luminosa, aproxima-se da fonte de luz. Na proximidade de obstáculos, afasta-se deles. Esta combinação de estímulo e movimento modifica o padrão sonoro executado ao vivo pelo computador. A sucessão de eventos musicais gera uma pequena improvisação que reflete a exploração do meio ambiente feita pelo Roboser” (MANZOLLI 2001A). “Roboser creates music based on the experiences and ‘emotions’ of a mobile robot as it explores its environment.”161 (BERNARDELLI 1999).

De início, o projeto do Roboser se enquadra de modo apenas indireto nas questões discutidas no momento. Em seu aspecto de realização ou “performático”, o projeto representaria uma aplicação composicional de princípios matemáticos, de uma forma que permite um sistema musical altamente interativo e autodeterminado; nesse caso, o robô seria apenas uma ferramenta “cibernética”, instrumental, para a formação de um novo tipo de manifestação musical, oferecendo novas possibilidades estilísticas e práticas. Na verdade, é desta forma que ele tem sido geralmente apresentado (cf. WASSERMAN 2001); tanto o êxito quanto implicações estéticas ou “performáticas” de tal “ferramenta cibernética”, e de suas relações com ambientes interativos envolvendo, por exemplo, a dança (que fazem parte de um dos projetos de pesquisa propostos para o Roboser), escapam totalmente do âmbito do presente trabalho.

Para além da interatividade com o ambiente e com outros “organismos” (robóticos, humanos etc.) que o experimento oferece, o ponto de interesse especificamente cognitivo é a própria forma de tradução, em termos musicais, dos dados sensoriais do sistema. O processamento “cognitivo” do robô (seu “cérebro”) se baseia em algoritmos matemáticos de inferência e categorização do material (dos “dados”) dos sensores eletrônicos; os dados gerados por este “cérebro eletrônico” alimentam um outro algoritmo, o composicional, devidamente apresentado como uma aplicação da “regra que transforma uma trajetória numérica numa seqüência de notas”(“rule that transforms a numerical trajectory in a sequence of pitches” - MANZOLLI, MAIA JR 1995). Em certa medida, ambos os sistemas também lançam mão de uma objetividade ou de um certo funcionalismo prático para o controle de suas realizações. Enquanto o sistema “sensorial” cuida da exploração e categorização do ambiente, bem como da auto-preservação do robô, de acordo com padrões de “inferência” bem específicos, o algoritmo composicional se utiliza das categorias musicais pré-definidas ou “outorgadas” (notas, ritmos etc.) para apresentar como musicais os resultados desta mesma exploração e categorização. Em termos teóricos, o experimento tem validade científica conforme consiga simular regras e “rotinas” comuns à cognição humana, tanto para a percepção do ambiente quanto para sua influência na produção de obras musicais. Como possibilidade especificamente composicional, é digno de nota o distanciamento estilístico das performances do robô em relação tanto a um padrão musical mais tradicional, tonal, quanto a modelos analíticos de percepção musical, como o de Lerdahl & Jackendoff. De fato, a possibilidade do robô desenvolver gradativamente um “esquema” pré-definido tanto de processamento sensorial quanto de procedimentos musicais (em algo identificável com uma “memória de longo prazo” humana, criando um “repertório de improvisação” para o robô) está entre os interesses futuros dos projeto (MANZOLLI 2001B).

Como contribuição a uma concepção cognitivista em música, porém, os avançados resultados da atividade do robô podem ser relativizados, na medida em que a própria definição de uma instância musical, a partir da qual seriam determinados os objetos musicais, é de certa forma ignorada, e em que o resultado último pode ser tratado, afinal, como tendo características não especificamente “cognitivas” ou “musicais”, mas mais propriamente estilísticas. O que se cria, assim, é não só um paradigma computacional para a composição musical, como também um paradigma composicional para os fenômenos musicais; dessa forma, o próprio diagrama de um modelo de “ciclo criativo” no processo de composição musical, proposto por Laske (LASKE 1991, no Capítulo III), deveria ser aplicável à produção do robô. As concepções envolvidas na interatividade do Roboser (em termos como “comunicação”, “emoção”, “cérebro”) tenderiam então não apenas a “antropomorfizar” a atividade computacional do sistema, mas também a indicar os próprios processos comunicativos e emocionais humanos (e musicais) também como processos “automáticos”, constituídos pela transdução automática de estímulos externos perceptuais, ou decorrentes de auto-organização (cf. com a “informação como grandeza física” citada por DUPUY 1996). De fato, parecem ser tais acepções que permitem a postulação da “Auto-organização como um paradigma composicional” (MANZOLLI 1995); o ambiente, antes de ser uma instância fundante de uma ontologia musical, é uma “influência” ao processo musical criativo já pré-estabelecido (auto-organizado), imbutido na transformação dos dados de análise do robô. Sendo ou não o resultado de uma interação com o ambiente, as variáveis que afetam a produção musical são descritas e organizadas de acordo com o programa computacional (as instruções que o descrevem e o controlam), e não afetam sua instância, sua definição - outra possível faceta da metáfora musical.

“A composição sofre influências ambientais que fazem com que cada processo criativo seja único. Assim, a produção musical é extremamente sensível a condições iniciais e há muitas componentes no processo desconhecidas para o músico. Para adaptar-se a estas mudanças, o compositor norteia-se por Ciclos Criativos. Grande parte do método composicional está baseado em tentativa e erro” (MANZOLLI 1995). “Dada a sua concepção funcionalista do mental, segundo a qual o facto de um sistema físico ter mente consiste na realização por esse sistema físico de uma determinada organização funcional, Dennett considera que não existe nenhuma diferença essencial entre a inteligência natural e a inteligência artificial” (MIGUENS S.D.).

Conexionismo e cognição musical

Para além de um comportamento linear (ainda que autônomo) dos fenômenos musicais, estes também podem ser modelados através de métodos em paralelo, ou em rede. Em primeiro lugar, numa “rede” de inter-relações inferenciais entre objetos musicais, ou mesmo “sonológicos”, da simples categorização dos conteúdos auditivos da acepção de Laske; ou seja, na apresentação da escuta como um processo não-linear, recorrente (ou recursivo), dinâmico e hierárquico. Assim, um modelo paralelo de processamento musical pode ser uma metodologia, antes de especificamente um mecanismo, tal como no artigo seminal de Marc LEMAN (1985), “Dynamical-Hierarchical Networks as Perceptual Memory Representations of Music”. Num desenvolvimento alternativo da “pragmática formal” de Laske e Kunst, apresentada acima, Leman rejeita uma “sintaxe musical” de forte caráter linear (como em Laske, ou por exemplo na teoria gerativa de LERDAHL & JACKENDOFF) em favor de uma representação computacional da memória na qual unidades estruturais (Structural Units) musicais formariam múltiplas relações (de semelhança, de causalidade, de variação etc.) entre si e suas qualidades (qualitative predicates), formalizadas em termos de proposições lógicas bivalentes e dinamizadas através de processos de inferência (inference) do material sonoro; num resultado multidimensional, estratificável e dinâmico, aberto a interpretações variáveis do mesmo sinal sonoro (Figura 16).

“Dynamic-hierarchical networks are perceptual representations of musical listening processes and are characterised by organised and hierarchised data-structures comprising several levels”162. “It is necessary to look at them [(the inferences)] in more detail because they are the core of the dynamics of every listening activity”163 (LEMAN 1985).

 

Figura 16 - exemplos de estruturas dinâmicas no modelamento em paralelo da “inferência” de um trecho musical (DEBUSSY - SYRINX). O nível “sonológico”, puramente auditivo, possibilita inferências (indicadas como linhas pontilhadas) de representações musicais, em termos de unidades estruturais (Structural Units, ou SUs - indicadas com retângulos). “O símbolo ‘  ’ mostra uma relação entre SUa e SUb“ (LEMAN 1985).

 

O artigo de Leman, com unidades complexamente inter-relacionadas e formando um todo fechado, introduz um modelo eminentemente estruturalista para o processamento musical, ou mais especificamente semântico, de sentido dado dentro do funcionamento global de um sistema (da teoria musical), ao contrário da importância da ordem linear, sintática, mais comum nas abordagens analíticas ou simbólicas (ver Capítulo IV). De fato, uma grande parte da terminologia adotada por ele para as questões pertinentes tem origem lingüística, identificando a música com uma “linguagem” específica cujas premissas cognitivas são mais uma vez explicitamente enraizadas em princípios psicológicos da Gestalt (ver Capítulo III). Mais do que um modelo metodológico, a linguagem verbal é descrita como parte ativa na própria constituição das unidades estruturais em música, sob a forma de conceitos e propriedades definidos explicitamente, formalmente, e identificados com uma “memória de longo prazo” (“long term memory”) de caráter tanto internalista (psicológico), quanto mais especificamente socio-cultural, de definição a partir das práticas musicais corriqueiras. Assim, seria através da linguagem, da possibilidade de conceituação ou de compartilhamento de informação, que tornariam-se possíveis os próprios fenômenos musicais; e nesse caso os processos cognitivos primários (gestálticos), clamados como “condição sine qua non da audição” e como premissa teórica para a postulação de uma cognição especificamente musical, são paradoxalmente confrontados com uma situação na qual é o conceito verbal, semântico, denotativo, que configura suas propriedades.

“We therefore could state the following: to the extent that music corresponds with natural language, there will be similarities between their respective representation formalisms”164 […] “The idea that verbal predicates are tagged to Strucutral Units is essencial for a theory of musical information processing. It enables us to explain the fact that listeners communicate with other listeners about music, it enables us to give a verbal description about the music we have heard”165 (LEMAN 1985; grifo do autor). “[For Leman], meaning emerges when relationships are perceived between musical events that are embedded in musical structures. His specific term for this kind of meaning is tone semantics, defined as ‘an example of meaning formation at a non-symbolic level’ that depends on ‘context-sensitive similarity relationships”166 (PARNCUTT 1998; grifo do autor).

O artigo de Leman situa-se num momento histórico e metodológico anterior ao grande fomento científico dado a modelos de redes de processadores interligados em paralelo, nos anos 1980, principalmente a partir da publicação de Parallel Distributed Processing (RUMELHART, MCCLELLAND 1986). Este tratado introduziu novos algoritmos matemáticos para operações em paralelo e deu grande impulso a linhas de pesquisa propriamente conexionistas, ou de desenvolvimento de sistemas envolvendo redes neurais, cujos reflexos no campo musical podem ser inicialmente exemplificados, ao que tudo indica, pelo seminal Music and Connectionism (TODD, LOY 1990). As próprias origens da história do conexionismo têm precursores preocupados com a percepção auditiva e musical-cognitiva (ex. PITTS, MCCULLOCH 1947), e o atual estudo da aplicação de redes neurais em música é mais recente, tão variado e tão fecundo quanto as aplicações de uma inteligência artificial mais ortodoxa e linear; há pesquisas em áreas como composição musical artificial, ritmo musical, estilística, improvisação, audição, localização no espaço, percepção de timbre, neuropsicologia, pulsação do swing em jazz, análise e criação harmônicas (tonais), leitura de partituras, execução de instrumentos musicais etc. (cf. GRIFFITH S.D.; HÖRNELL S.D.; SMITH S.D.).

Já numa apropriação mecânica, lógica, e não simplesmente teórica (como no artigo de Leman) de um modelo em paralelo para as relações conceituais em música, os sistemas conexionistas concebem uma “arquitetura” computacional baseada epistemologicamente no funcionamento cerebral, ou mais especificamente neuronal (como já apresentado no Capítulo II). Ao invés de um único processador eletrônico alimentado linearmente com informações musicais traduzidas em linguagem de computador (como nos modelos da inteligência artificial tradicional), são definidas várias unidades de processamento interligadas entre si, influenciando-se mutuamente de acordo com o nível de sua atividade e a forma como estão inter-conectadas. É o comportamento coletivo do conjunto de cada uma das unidades de processamento que é considerado como “resultado” ou “resposta” do processamento da rede como um todo; assim, as redes não são apenas capazes de chegar a um resultado computacional efetivo de maneira similar à dos modelos computacionais seriais, só que a partir de uma estrutura alternativa à lógica proposicional tradicional; são capazes também de se adaptarem, livremente e sem uma pré-programação, a situações divergentes da tarefa estipulada inicialmente, permitindo considerar o funcionamento de tais redes como o de um verdadeiro autômato artificial.

As possíveis variações entre os elementos constitutivos da rede (quantidade de unidades de processamento, forma de ligação entre elas, forma de apresentação computacional dos dados e das unidades que recebem estes dados etc.) dão origem a diferentes formatos utilizados atualmente de redes neurais (MEDLER 1998): há redes supervisionadas, nas quais é dada à rede um resultado de ativação como meta e, através de várias seções de “aprendizagem”, ou de apresentação consecutiva de dados, a rede acaba se configurando de forma a processar as informações de acordo com este “modelo”; há redes auto-organizadas (ou não supervisonadas), que não passam por um processo inicial de “aprendizagem” e são geralmente usadas como reconhecedoras de padrões (patterns) no sinal de entrada, com as unidades de saída formando um “mapa” de ativações simultâneas; há redes que seguem uma teoria de ressonância adaptativa (Adaptative Ressonance Theory - ART), nas quais a informação de entrada é comparada com vários padrões pré-estabelecidos (comparáveis ao papel de uma memória de longo prazo nos processos cognitivos), podendo ser identificada como um destes padrões ou, caso contrário, criar um novo padrão independente, também armazenável; etc.

As arquiteturas de rede neural utilizadas em pesquisas musicais são bem variadas, mas com uma tendência a utilizar redes auto-organizadas ou não-supervisionadas, especialmente nos processos que exigem não uma reação "passiva" à entrada de dados, mas uma "ativa", que crie diferentes respostas a novas situações. Os trabalhos de KOHONEN (1984) e GROSSBERG (1982), relativos à arquitetura deste tipo de rede conexionista, são bastante citados. Estes autores têm inclusive suas próprias contribuições para a área (GOVINDARAJAN, GROSSBERG, WYSE, COHEN 1994; KOHONEN 1989). Na representação da apresentação temporal ou seqüencial de dados dentro do processamento das redes, fundamental no aspecto temporal em música, o modelo mais adotado parece ter sido em grande parte a arquitetura atribuída a JORDAN (1986), na qual algumas unidades armazenam o estado das unidades de saída no processo anterior de computação, ou de ativação das unidades. De acordo com TODD (1989a), as características típicas desta arquitetura, com unidades de "contexto" copiadas das unidades de saída do processamento anterior, são mais passíveis de uma interpretação cognitiva e musical que as criadas por unidades “escondidas” (hidden), que não apresentam dados visíveis ao observador externo à rede e participam apenas do processo de computação, como por exemplo na arquitetura conferida por ELMAN (1990) (Figura 17).

 

A)

B)

Figura 17 - exemplos de arquitetura de redes neurais de processamento sequencial, ou temporal: a) rede de Jordan; "JORDAN 1986) descreve uma rede contendo conexões recursivas usadas para associar um modelo estático (um 'plano' - 'plan') com um padrão de saída ordenado seqüencialmente (uma seqüiência de 'ações'). As conexões recorrentes permitem às unidades ocultas da rede ('hidden') utilizar o resultado da computação anterior da rede, de forma que o comportamento subseqüente pode ser modelado pelas respostas prévias do processo de computação". b) rede de Elman; "[As unidades de contexto] também estão ‘ocultas', na medida em que interagem exclusivamente com outras unidades internas à rede, e não diretamente com o mundo externo" (ELMAN 1990).

 

“In networks employing hidden units and a learning algorithm, the hidden units develop internal representations for the input patterns which recode those patterns in a way which enables the network to produce the correct output for a given input. In the present architecture, the context units remember the previous internal state. […] Thus, the internal representations that develop are sensitive to temporal context; the effect of time is implicit in these internal states. Note, however, that these representations of temporal context need not be literal. They represent a memory which is highly task and stimulus-dependent”167 (ELMAN 1990).

Se o conexionismo representa um novo paradigma dentro dos estudos nas ciências cognitivas, ele o faz na medida em que pode trazer novos paradigmas para a forma como conhecemos, categorizamos e reagimos ao ambiente e ao mundo. Os conceitos simbólicos, a ordem de seqüências de eventos cognitivos, as inferências de sentido - categorias, antes de tudo, passível de tradução conceitual nas categorias lingüísticas (semântica, sintaxe, pragmática etc.) - não são mais demonstrados através de proposições matemáticas, lógicas ou meramente gramaticais, mas na emergência de uma dinâmica própria, definida e de certa forma auto-determinada, que não depende nem da intenção pessoal, humana, nem da regra coercitiva funcionando em termos estruturais. Diga-se de passagem, foi justamente a partir de concepções novas e pouco ortodoxas para os objetos e os processo lingüísticos que a reputação dos modelos conexionistas adquiriu novo ímpeto (cf. COPELAND 2000).

“[In this view], representations are not abstract symbols but rather regions of state space. Rules are not operations on symbols but rather embedded in the dynamics of the system, a dynamics which permits movement from certain regions to others while making other transitions difficult. [...] I suggest that the nature of the rules may be different than what we have conceived them to be”168 (ELMAN 1990). “Linguistic representations emerge as a function of the interplay among several factors, including the physical components of the human brain that are active during language processing (and their characteristic manner of processing information), the tasks such components are engaged in, and characteristics of the language signals to which they are exposed, particularly their statistical aspects. This view has arisen contemporaneously with and partly as a consequence of connectionism, which has provided novel views of both the nature of mental representation and the ways in which such representations might be learned”169 (ALLEN, SEIDENBERG 1999).

Entretanto, muitas das aplicações de processamento de redes neurais no campo musical baseiam-se, num número considerável de vezes, numa apresentação de eventos musicais estabelecidos (notas, ritmos etc.) diretamente como unidades de entrada ou de processamento da rede e de suas unidades. É o que permite reduzir acepções de modelos conexionistas em música grosso modo a operações computacionais sobre representações musicais - ou seja, a música já está transformada em signo musical antes do processamento da rede neural, na própria apresentação do problema (Figura 18), o que reduz significativamente o valor de um tal sistema como causa cognitiva (ou como possível solução para uma metáfora musical). A propósito, tem sido um forte argumento de crítica a muitas empreitadas conexionistas em geral a forma como a representação simbólica ou processual “emanaria” do funcionamento da rede, ou estaria ao contrário embutida já em sua arquitetura, na apresentação de dados a ela etc. (cf. ALBANO 1990; ver Capítulo II).

Há um limite teórico, tênue e geralmente ignorado, entre o funcionamento das redes e o real funcionamento dos processos neuronais, ou mesmo individuais, permitindo um intercâmbio teórico mais ou menos livre entre “o que a rede faz ou aprende”, “o que o cérebro pode fazer ou aprender” e “como nós (ou, por exemplo, crianças) fazemos ou aprendemos coisas” (ex. ELMAN 1993; ROHDE, PLAUT 1999). No terreno musical, as pesquisas em conexionismo divergem entre si muito mais nos tipos de arquitetura neuronal aplicadas, do que propriamente no tipo de objeto musical ao qual elas são dedicadas, reprodução por sua vez, em grande parte, do conteúdo do sistema musical vigente ou das práticas musicais estabelecidas. As redes simulariam relações entre signos musicais, e estariam portanto ligadas a processamento combinatório de alto nível cognitivo, e suas propriedades não representariam, de maneira direta e natural, as propriedades “subsimbólicas” dos sistemas neuronais ou cerebrais concretos, envolvidos no processamento mental em música; então, poderiam ser consideradas uma outra forma de antropomorfização (de naturalização científica) de um sistema computacional e de um sistema musical, de onde “emanam” relações entre signos pré-determinadas pelas próprias práticas musicais. A partir daí, é razoável esperar a ratificação e adequação, por exemplo, a modelos cognitivos de caráter mais semiótico ou semiológico, de “objetos musicais”, como os apresentados no Capítulo IV, sejam especificamente notas e termos da teoria musical (SCARBOROUGH, MILLER, JONES 1989; TODD 1989A; etc.), seja outros elementos convencionais determinados pela tradição musical (GJERDINGEN 1989), identificáveis também com a acepção “semântica” de LEMAN (1985).

 

A)

  

B)

C)

               

Figura 18 - exemplos de arquitetura de redes neurais de processamento musical: a) rede de classificação de tipos de acordes (“chord type” - combinações triádicas de notas) a partir da ativação de representações de alturas musicais (LADEN, KEEFE 1989); b) rede de classificação de acordes, tonalidades (“key”; “major mode” - tonalidade maior) e funções harmônicas (relações entre classes de alturas musicais - tônica, subdominante, dominante) a partir da ativação de representações de alturas musicais (“pich class”) - “o diagrama mostra, por exemplo, que ao nível nos processadores de tonalidade (‘key node level’), a unidade de ativação do maior (C major) é ativada pelos acorde de do maior (tônica), fa maior (subdominante) e sol maior (dominante)” (SCARBOROUGH, MILLER, JONES 1989); c) “Uma rede sequencial de n elementos capaz de aprender a produzir uma seqüência de notas, usando uma memória das notas já produzidas. Esta memória é fornecida pelas conexões de realimentação da informação de saída (‘feedback’)” (TODD 1989).

 

 

Mesmo redes mais ligadas a um modelamento da percepção acústica ou auditiva - como a percepção dos harmônicos sonoros e de seu papel nas estruturas da harmonia tradicional (LADEN, KEEFE 1989) ou a projeção conexionista do funcionamento das fibras nervosas do ouvido interno, para unidades de saída representando as alturas musicais (SANO, JENKINS 1989) - podem ser reduzidas muitas vezes à formalização (complexa) das relações entre elementos do sistema musical tradicional. Acima de tudo, o sistema musical (e o resultado experimental) são de certa forma apresentados sem prévia discussão como “naturais”, como emanados de um sistema (ou talvez de uma “musicalidade” disseminada) já auto-determinado por sua própria constituição. O que permite, mais uma vez (cf. Capítulo II), identificar modelos conexionistas com teorias-limite acerca do fisicalismo e do trans-humanismo dos processos cognitivos, que seriam manifestações de relações já atuantes nas propriedades físicas que lhe seriam próprias. Se a representação musical e as redes conexionista são tomadas como modelo do processamento cognitivo e individual, o que se tem como resultado não é apenas uma “máquina de Turing” capaz de imaginar (e não apenas reproduzir) melodias, mas principalmente a mecanização do sistema musical como princípio implícito de definição de uma ontologia (de uma sub-representação a nível computacional) da música. O sistema representacional tomado como o objeto em si: a metáfora musical.

“The network learns to put one melody at a point identified by the first plan, another melody at a point identified by the second plan, and so on for all the melodies and plans in the training set. When it is given intermediate (or extrapolated) plans, the network then indexes some new point in the melody space between (or beyond) the original melodies. Depending on the structure of the melody space constructed, different new melodies will be produced”170 (TODD 1989A). “Often we know what we like without really knowing exactly why we like it. In this case, a neural network approach is attractive. We can simply show the network examples of good and bad rhythms (telling it which are good and which are bad), and let it learn to mimic our judgments”171 (DOLSON 1989; grifo do autor).

É certo que, para além do signo musical tomado como objeto científico (ou de simulação cognitiva), podem também ser encontrados modelos que se fundam peremptoriamente nos resultados de uma psicologia cognitiva (e também uma neuropsicologia) voltada para o processamento auditivo e para a música. De fato, não são poucas as teorias que procuram conjugar modelos conexionistas (do tipo bottom-up) e neuropsicológicos (do tipo top-down) sobre processos musicais e auditivos, seguindo de perto as premissas de um eliminalismo materialista (como já apresentado no Capítulo II) que busca na pesquisa científica uma causalidade explanatória para todas as características dos processos cognitivos, num todo integrado, ou, já no campo musical, numa musicologia sistemática (ex. LEMAN 1989; LEMAN 1995; BAIRD 1997; etc.) que inter-relacione de maneira causal estruturas musicais com processos sonoros (ou auditivos). Por envolver definições de psicologia cognitiva e neuropsicologia, faz-se por bem no momento protelar a descrição de modelos como estes para o Capítulo VI.

E também é certo que, afinal, não encontra-se definido atualmente o verdadeiro status epistemológico das redes neurais dentro das explicações acerca de nossos processos cognitivos. Seriam as redes neurais representantes do funcionamento cerebral, neuronal, ou de uma estrutura própria e auto-organizada dos objetos simbólicos? As redes conexionistas demonstrariam, por sua simples possibilidade de existência, propriedades subsimbólicas nos objetos aos quais são aplicadas? No caso musical, qual seria a variedade de possíveis redes neurais aceitáveis como modelo? Todas? Nesse caso, o que realmente estaria sendo testado? No caso inverso, isto é, da aplicação de processamento de uma mesma rede para conteúdos musicais culturalmente diversos (ex. BHARUCHA, KRUMHANSL 1983), a tendência é atribuir aos conteúdos musicais propriedades cognitivas não só especificamente musicais, mas gerais, universais (multimodais - CROSS 1999B), como a noção de níveis de expectativa ou de expectância (ver Capítulo VI), identificáveis com princípios de funcionamento da harmonia funcional (BHARUCHA, TODD 1989) ou da métrica rítmica (DESAIN, HONING 1989) - e também com postulações condizentes em outras áreas da cognição musical (ex. CROSS 1999B). A universalidade indicada nestes casos, é da “Música ela mesma”, ou do sistema, da teoria musical, de uma “probabilidade de eventos” estatística, ou coercitiva, de objetos musicais definidos?

“No rules needed to be encoded for these patterns to emerge, they simply reflect the internalised of probability distributions through extended exposure to individual sequences”172 (BHARUCHA, TODD 1989).

Sistemas interativos e cognição musical

Nesse último caso, evidências de um comportamento musical de “expectâncias” disseminado nos processos cognitivos pode ser apontado, paradoxalmente, no seio de trabalhos ligados à Lingüística. Grande parte das pesquisas engajadas pelos lingüistas Robert PORT & Michel GASSER, por exemplo, concerne ao papel do ritmo na linguagem e na cognição de forma geral, e nos resultados de uma representação particular de sua natureza através de unidades de processamento ligadas em rede. Sua concepção baseia a estrutura cognitiva dos ritmos em proporções duracionais correspondentes a frações temporais simples de 2, 3, 4, tanto para linguagem (PORT, CUMMINS, GASSER 1996) quanto para música (PORT, ANDERSON 1989), implementáveis em termos de redes neurais através de um modelo simples e “elegante” formado com a associação de osciladores eletrônicos entre si, com apenas uma unidade comum tanto à entrada de dados (numa fase de percepção do ritmo) quanto à saída (numa fase de produção do ritmo). As conexões da rede irão controlar as formas pelas quais os pulsos de cada oscilador (e os presentes no sinal da unidade de entrada) se combinarão dentre si de acordo com relações de ajuste de fase (“phase coupling”), até estabilizarem-se num todo coerente e sincronizado (Figura 19).

 

Figura 19 - diagrama de funcionamento de uma rede de percepção e produção de pulsações métricas, indicando a unidade de entrada e saída de sinal (“input-output unit”) e três osciladores interligados, cujos diâmetros representam a freqüência de oscilação da unidade (GASSER, ECK, PORT 1997).

 

O resultado é um sistema ao mesmo tempo extremamente simples e eficiente no reconhecimento e reprodução de sinais contendo pulsações métricas, e tolerante com variações locais (GASSER, ECK, PORT 1997). Um tal mecanismo de produção e percepção rítmica é gerado através de métodos bastante simples de inter-relação entre unidades “pulsantes”, dispensando uma concepção puramente formalista, normalista, da conceituação teórica dos fenômenos rítmicos. Para além de uma “regra de categorização”, computacional ou não, dos estímulos sonoros ou periódicos, os fenômenos rítmicos podem ser apresentados então como um processo de sincronização entre unidades pulsantes, como uma manifestação “mecânica universal do corpo humano, e não tenha nada a ver com uma cognição [apenas] lingüística” ou apenas musical. De fato, outras formas de associação em rede entre unidades de osciladores (TODD, O’BOYLE, LEE 1999; BARBOSA 2001) baseiam-se em teorias motoras ou sensóreo-motoras funcionando no cerne de processos cognitivos, com por exemplo em uma Fonologia Articulatória (BROWMAN, GOLDSTEIN 1986). Contrapondo-se a uma representação baseada num sistema musical, os elementos rítmicos surgiriam da própria relação oscilatória ou periódica entre seqüências de fenômenos, sejam musicais ou não (intencionais ou não, humanos ou não); a diluição das fronteiras entre música e Lingüística se dá então sob a forma de mais uma teoria-limite de sua distinção epistemológica, mais um sistema dinâmico, auto-organizado, definido para além da objetividade normativa, metodológica e prescritiva da ciência.

“When an adaptive oscillator is stimulated in a roughly periodic way, it could be said to ‘represent’ an estimate of input rate and should be able to ‘predict’ the next few phase zeros into the future”173. […] “If meter exists in the minds of speakers and listeners, it is not likely to take the form of a static description expressed in terms of perfect integer relationships as in musical notation. Meter is a skill, manifested as a particular mechanism, a means by which signals are processed, guided by underlying tendencies toward periodicity. […] This mechanism self-organizes to discover and reproduce the temporal regularities in the input.”174 (GASSER, ECK, PORT 1997). “The internal clock hypothesis says that cognitive systems have one oscillator that acts as a pacemaker which delivers regular beats to motor areas in the brain. This implies that all motor activities as breathing, walking, roaming, mastication and speaking would be timed by such a clock.”175 (BARBOSA 1998).

Dessa forma, a proposição de sistemas dinâmicos em cognição musical deve ultrapassar a idéia de um organismo (identificável com um indivíduo) de onde emanam relações musicais, para considerar o próprio sistema musical como estabelecido em interações dinâmicas entre organismos ou indivíduos, através da apropriação de conceitos como o de agente. A aplicação de princípios de auto-organização em softwares de simulação de auto-reprodução biológica (os chamados autômatos celulares) pode ser usada por exemplo como base na criação de objetos musicais, de maneira similar à tradução “musical” da simulação cognitiva do Roboser, tal como na pesquisa de Eduardo Reck MIRANDA (1993). Os resultados, relevantes dentro da atual produção em música contemporânea, podem ser considerados “pragmáticos” (MIRANDA 2000), isto é, aceitáveis apenas na formulação de uma nova prática musical ou composicional (do pesquisador, não do autômato), da mesma forma que a análise do experimento robótico apresentada anteriormente; Miranda admite que “as técnicas de transferência do comportamento dos modelos para a música pareçam arbitrárias”, isto é, sem base para postulações causais de processos cognitivos (ou auto-organizados) em música. Por isso, as características dinâmicas do sistema interno de funcionamento do autômato (consideráveis como insuficientes na definição de uma instância musical auto-gerada) são transpostas posteriormente para um processo evolucionista, de um sistema informacional constituído por uma comunidade de agentes virtuais (computacionais) interagindo num processo auto-organizado, isto é, de “aumento do grau de complexidade” e estabilidade do sistema. Tal concepção, diga-se de passagem, é proveniente de experimentos em fonologia e inteligência artificial (DE BOER 1997), e os mesmos princípios que conduzem ao aparecimento, no seio destas “comunidades de agentes” em interação, de formantes vocálicos176 de freqüências similares aos determinados na fonética, podem também possibilitar o surgimento de escalas de alturas musicais, ou de outros elementos e formas em música. Em outras palavras, uma interação livre, não-planejada, entre agentes compartilhando um mesmo campo de informações (ou de “cognições”) gerou por assim dizer “espontaneamente” (ou de maneira auto-organizada), tanto vogais quanto notas de uma escala musical, a partir do mesmo processo. Mais uma vez, tem-se aqui uma teoria-limite de caráter dinâmico na fronteira entre um comportamento lingüístico e um comportamento musical.

“Proponho que a música possa ser modelada como um sistema adaptativo de sons usados por um grupo de indivíduos (agentes distribuídos, no jargão das ciências da computação) empenhados em uma atividade musical coletiva. Alguns podem estar ouvindo os sons (‘audiência’) enquanto outros podem estar envolvidos no processo generativo (‘músicos’). Minha hipótese é de que formas musicais resultem da interação entre agentes que se empenham em atividades musicais. Este modelo pode ser comparado a uma sessão de improvisação musical onde pessoas que podem não se conhecer entram na roda e executam sons ou simplesmente ouvem” (MIRANDA 2000).

O artigo de Miranda cita como base conceitual, entre outros, a noção de “jogos de linguagem” de WITTGENSTEIN (1953), na qual o paradigma de normatividade e formalismo internos (psicológicos), necessários e precisos entre os objetos lingüísticos ou representacionais é substituído pela idéia de um sistema construído em relações de sentido entre sujeitos (intersubjetivas), externo (social), público, disseminado e dinâmico (ver Capítulo II). Assim, o conceito de agente pode ser então alçado de uma concepção computacional para poder ser enfim apresentado em um contexto cultural ou mais propriamente intersubjetivo, da relação entre um indivíduo e um sistema musical, de construção do sentido musical, onde o objeto não é dado como pré-estipulado; a atividade musical (composicional, performativa, fruitiva), antes de ser uma mera reprodução de um sistema cultural ou cognitivo (mesmo que concebido como complexo e dinâmico), estipularia limites e apontaria para direções de mudança deste sistema. Nestes termos, a atividade musical (ou mais precisamente a atividade composicional) pode ser considerada como o próprio modelo de atividade ou “prática” semiótica (ou cognitiva), numa inversão paradoxal das relações geralmente abarcadas por uma metáfora musical (como em CHOI 1996). Por sua vez, o programa (e a evidência cognitiva) computacional envolve a recriação de parte do sistema musical em sua elaboração e em suas práticas, o que permite concebê-lo afinal como uma ferramenta não só metodológica ou modelativa, mas incluindo sua dimensão cultural ou social, de interferência dinâmica na concepção atual dos signos e das atividades musicais.

“Understanding that a project of composition has a history of interactivity between a composer and a system, we can regard this dynamical aspect as the mode of interactivity with the system. […] The composer may make an articulation in this complex environment by a composition of observations of the semiotic process. The recognition and ambiguities that occur may be said to be composed without a specification of universally recognized symbols as an ultimate reference. New information may become articulated in relation to the limits of knowing symbolic systems”177 (CHOI 1996). “Instead of trying to predict a performance of tabla drum music - a prediction made from a supposed comprehensive knowledge of all the rules inherent in a set of improvisatory procedures - [the program] modelled its own creative processes on limited sets of data. This data was drawn from actual performances, and may have represented only a fragment of the drum ‘language’ as a whole”178 (KIPPEN, BEL 1994).

A última citação descreve parte da conceituação envolvida na concepção do Bol Processor, um software de análise e produção de dados musicais próprios da tradicional cultura percussiva da tabla, do norte da Índia. Esta prática musical, baseada numa “representação oral de sílabas onomatopaicas que representam as batidas da percussão” (KIPPEN, BEL 1994), apresenta muitas características dessemelhantes da representação musical (ou da notação musical) comumente utilizada como base de experimentos cognitivo-computacionais em música, colocando em discussão científica (e cognitiva) a influência da determinação cultural, procedimental ou pragmática, dos conteúdos musicais. As abordagens computacionais em cognição musical, quando colocadas num contexto cultural - ou, como na abordagem de KIPPEN (1992), mais especificamente etnológico, a ser tocado de perto no Capítulo VII -, não podem mais se resguardar em uma instância a-histórica e universalista (de acordo com o ideal científico), de seu papel na construção (por sua própria proposição) e na manutenção de uma teoria e de uma prática musical bem específicas, tomando tais instâncias como “universais” na medida em que estas próprias teorias e práticas são tomadas como tais (a metáfora musical). As instâncias formadoras, os conceitos técnico-musicais, os resultados e as conseqüências funcionais, estilísticas e históricas de tais abordagens devem co-participar da própria dinâmica de suas afirmações, por atuarem (de modo dinâmico) no complexo sistema cultural que denota os fenômenos musicais. A partir daí, o funcionalismo e o normalismo presentes em suas concepções podem ser então considerados para além de meros “produtos” despersonalizados da instituição científica, na medida em que influirão nas relações dinâmicas (e também sociais, ou sociológicas) entre as diferentes práticas musicais humanas - seja como ferramentas metodológicas, ou estilísticas, ou ideológicas.

“The analytical process itself begins with the elaboration of statements about the music and its structure at a general level using techniques derived from the theory of formal languages, a development from Chomskian theory. These statements, presented in the form of a transformational/generative grammar, reflect both verbally articulated musical theory (for example, relating to the metric cycles in which pieces are set, the repertoire of strokes to be used, etc.) as well as non-articulated, intuitive knowledge gleaned from analyses of performances (feasible combinations of strokes, the counterbalancing of fixed and improvised material, etc.). Once entered as a knowledge base of formal rules, it is the grammar that modifies the behaviour of the computer. (Incidentally, there is no direct interaction between the analyst and the internal workings of the machine itself; that area of programming is left to a computer-scientist.)”179 (KIPPEN 1992). “The cognitive model suggested by discretization in computational theories is informed by an ideology of a transcendent signed. This is not to say that computational theories assume their real-world models are ideally accurate; rather, the computational theory assumes an idealized relationship between nonterminal symbols in different hierarchies encompassing both computation and cognition. This assumption constitutes an ideology180 (CHOI 1996).

 


Notas

 

130 “Com ou sem cognição musical, a teoria musical sempre esteve apontada para a questão de como os seres humanos experimentam música. Quando construímos programas de computador para simular aspectos de habilidades musicais, fazemos por bem em seguir as linhas-guia que esta tradição possa indicar”.

131 “O conceito de 'algoritmo' pode ser solicitado para explicar a noção de uma 'descrição precisa' de um fenômeno. Esta noção é especialmente importante no domínio da pesquisa científica, onde clama por uma representação tão precisa quanto possível do domínio sob estudo [científico]”.

132 “Se nosso pensamento consciente envolvesse fenômenos não-algorítmicos, haveria a possibilidade de comportamento não-algorítmico entre as leis físicas”.

133 “Está claro que pelo menos algumas habilidades mentais são algorítmicas. Por exemplo, eu posso conscientemente realizar longos cálculos de divisão seguindo os passos de um algoritmo que solucione problemas de divisão longos. [...] Neste caso, como fora descrito por TURING (1950), eu, o computador humano, e o computador mecânico, estamos implementando o mesmo algoritmo, que eu executo conscientemente, o computador mecânico, inconscientemente. Nesse ponto parece razoável supor que haja também uma quantidade considerável de processos mentais ocorrendo em minha mente inconscientemente, que também sejam processos computacionais. E se é assim, podemos descobrir como o cérebro funciona simulando estes mesmos processos em um computador digital. Assim como obtivemos uma simulação computacional dos processos matemáticos para longas divisões, também poderíamos obter uma simulação computacional dos processos de compreensão da linguagem, da percepção visual, de [processos de] categorização etc”.

134 “Eu necessito de um mecanismo para a relação existente entre organismos e proposições, e o único que posso imaginar é uma mediação por representações internas”.

135 “A questão básica na Ciência Cognitiva é, Como poderia um mecanismo ser racional? A resposta séria a esta questão é [...] que ele pode ser considerado racional na qualidade de uma dispositivo de testes, isto é, de um mecanismo que tenha qualidades representacionais - estados mentais que representam estados do mundo - e que possa operar nestes estados mentais em virtude de suas propriedades sintáticas. A idéia básica em Ciência Cognitiva é a idéia da teoria de prova, isto é , que pode-se simular relações semânticas - em particular, relações entre pensamentos - por processos sintáticos”.

136 “Está claro, como enfatizaram KATZ, FODOR (1963), que o significado de uma sentença se baseia no significado de suas partes elementares e na maneira destas se combinarem. Também está claro que a forma de combinação dada pela estrutura superficial (constituinte imediato) em geral é quase totalmente irrelevante para a interpretação semântica, ao passo que as relações gramaticais expressas nas estruturas profundas abstratas são, em muitos casos, apenas aquelas que determinam o significado da oração”. (tradução - Pérola de Carvalho)

137 “Assim como na teoria de Katz & Fodor, algum tipo de ‘vocabulário’ pré-estabelecido seria necessário, mas no caso da música ele seria incompleto antes da audição de uma composição. Tal vocabulário de símbolos seria então preenchido por representações dos motivos musicais, que surgem na obra musical enquanto ela segue seu curso”.

138 “[…] Propriedades mais relevantes, em termos comportamentais, do estímulo [do ambiente], são uma seleção das propriedades que pertencem ao estímulo: de todas as propriedades que o estímulo contém realmente, apenas aquelas relevantes em termos comportamentais são as que o organismo representa como contidas [no estímulo]”.

139 “Talvez a conseqüência geral mais importante da escola psicológica da Gestalt [...] seja sua demonstração do quanto a percepção é o resultado de uma interação entre o input ambiental e os princípios mentais ativos que impõem estruturas a este input”.

140 “Uma vez que se aceite que, para adquirir um conceito, deve-se estar habilitado a representar conceitos reduzidos a uma hipótese, e dado que muito do pensamento é lingüístico, e especificamente, que a maioria ou mesmo a totalidade do conceitos podem ser expressos em forma lingüística, segue-se que uma linguagem com predicados cujos significados sejam os conceitos deduzidos últimos é requerida de maneira a adquirir outros conceitos. (Se CACHORRO pode ser realmente reduzido a DE QUATRO PATAS, COM RABO, PELUDO, LATIR, e se estes são por sua vez primitivos, é necessária uma linguagem que predique expressamente estes conceitos). O que vale dizer, deve haver uma linguagem do pensamento inata com predicados que expressem os conceitos primitivos. Uma vez que as línguas naturais não são inatas, segue que cada adquirente da linguagem deve possuir uma linguagem do pensamento distinta de todas as outras línguas naturais”.

141 “Eu argumentarei, primariamente, que não se pode aprender uma linguagem com termos que expressem propriedades semânticas não expressadas em termos de alguma linguagem já capacitada para uso”.

142 “O ponto aqui é que a psicologia passa a ter a partir de agora não dois domínios de interesse, cérebro e mente, mas três: o cérebro, a mente computacional, e a mente fenomenológica. Conseqüentemente, a formulação de Descartes para a questão [da relação entre] mente-corpo é dividido em duas questões diferentes. O problema 'mente fenomenológica-corpo' [...] é, como pode um cérebro ter experiências? O problema 'mente computacional-corpo' é, como pode um cérebro desenvolver o pensamento racional? Além deste, temos também o problema mente-mente, isto é, qual é a relação entre estados computacionais e experiências (fenomenológicas)?”

143 “A teoria da estrutura musical de Lerdahl e Jackendoff, sem sobra de dúvida, não é uma teoria formal que possa ser representada algoritmicamente. O problema de desenvolver uma teoria formal e precisa da estrutura e do processamento musical, que está na base do modelamento cognitivo da percepção musical [...], existe até hoje”.

144 “O conceito de computação em música mudou radicalmente no final da Renascença, quando passou da compreensão matemática das leis intrínsecas de consonância para a idéia (leibniziana) de um mundo musical gerado por regras combinatórias”.

145 “Os conjuntos de alturas usado na música tonal - escalas, modos, acordes e tonalidades -, quando considerados em termos matemáticos dentro de representações computacionais, têm exibido algumas extraordinárias propriedades que os capacitam de forma exemplar para uso na seqüência de padrões temporais (BALZANO 1980; BROWNE 1980)”.

146 “Duas correntes nos modelos musicais existentes podem ser distinguidas [...]. A primeira é uma abordagem algorítmica, de ‘processamento de informação’ [...]; a um modelo é fornecido um input, e ele produz algum output: a forma através da qual tal modelo se aproxima do output de um ouvinte [real] (ou intérprete, ou quem quer que seja) constitui o critério de seu sucesso. […] A segunda corrente [...] é derivada de conceitos lingüísticos, tornando explícita a noção de ‘linguagem’ musical e procurando formular gramáticas de tal linguagem”.

147 “O sinal acústico, como percebido pelo ouvinte, pode ser encarado como uma representação em ‘linguagem de baixo nível [computacional]’ da informação musical. Uma representação em termos de quais notas são executadas por quais instrumentos, isto é, uma decomposição desta informação em partes, pode ser descrita como constituindo uma representação em ‘linguagem de máquina’ da informação, dado que podemos prover a definição da ‘máquina’ adequada (isto é, do processador musical)”.

148 “[…] assim como a grande maioria trabalhos de pesquisa em teoria musical mostram, há um conjunto de regras [sintáticas] bastante específicas controlando a maior parte de tipos de música, e uma gramática gerativa poderia oferecer um meio útil e avançado de expressá-las”.

149 “Devemos dizer que a música não é mais similar à linguagem que qualquer outro objeto no mundo, e as únicas relações válidas que podemos esperar [entre elas] são as de contigüidade”.

150 “Uma obra musical é a memorização de notas passadas. Isto significa que uma obra é reconhecida pela retenção de notas na mente através da percepção”.

151 “Essencialmente, a irreversibilidade do tempo é dissolvida, e um fenômeno [musical] é representado e reconhecido espacialmente [...]; quanto mais alto for o patamar [instanciado] e por conseguinte a dependência do conhecimento de regras anteriores, mais arbitrárias as regras se tornam, por estarem mais livres dos processos perceptivos e poderem ser estruturadas artificialmente”.

152 “LONGUET-HIGGINS (1987) interessou-se por como a forma através da qual uma simples melodia pode ser transcrita pode refletir a estrutura de dados que já embutimos em nossa mentes para descrevê-la”.

153 “O teclado do piano, tomado por si mesmo, é um metaprocesso, isto é, uma descrição de um processo. [...] Outro exemplo básico de um metaprocesso é uma partitura musical”.

154 “LASKE encara o processamento semântico como uma forma de reconstrução. Isto é, um ouvinte que percebe um evento musical pode dizer que ‘compreendeu’ tal evento se ele é capaz de especificar como ele pode ser reproduzido”.

155 “Uma experiência musical, em termos pragmáticos, é o total de todos os ‘passados’ atuais que um ouvinte tenha construído durante uma situação de escuta”.

156 “Nós sugerimos […] que o processamento musical pode ser visto como envolvendo uma base de dados relativamente pequena formada por entidades primitivas de níveis perceptuais mais altos, e que pode se supor que um programa da performance necessária está operando a partir desta base de dados. Este ponto de vista do problema da análise musical como um procedimento tem uma vantagem metodológica ao lançar luz no uso de modelos conceituais usados em análise musical, ao invés de tratar tais modelos sem uma postura crítica, como dados, ou encará-los de forma ideológica”.

157 “Estamos buscando por fatos inquestionáveis - ou mais que isto, por verdades objetivas - sobre música e sobre a mente musical, ou estamos falando, ao invés disso, sobre os processos de nossas próprias mentes como intérpretes da informação [musical]? Afinal, nós programamos nossos computadores para fazerem aquilo que queremos que eles façam, e portanto determinamos a natureza de muito da informação que requeremos de nossos experimentos”.

158 “Há limitações no modelo computacional serial, porque foi se tornando bastante evidente o fato de que a transdução dos estágios perceptualmente mais primitivos são fundamentalmente e maciçamente paralela por natureza. Uma metáfora do computador serial [para os processos cognitivos], portanto, vai gradualmente sendo substituída por uma metáfora cerebral. O estudo da inteligência, assim, deverá ser descrito não apenas em termos de uma inteligência 'artificial', mas também em termos de inteligências 'naturais', e as ciências cerebrais, tanto quanto uma abordagem neurobiológica, são ferramentas direcionadoras ao prover uma base empírica para o estudo da inteligência humana”.

159 “A linguagem de máquina [dos computadores] difere da linguagem de input/output [cognitiva] na medida em que suas fórmulas correspondem diretamente às operações e estados físicos relevantes da máquina. A física inerente à máquina garante assim que a seqüência de estados e operações que ela perfaz ao longo de seus processos computacionais respeite as restrições semânticas das fórmulas de sua linguagem interna. O que toma o lugar de uma definição verdadeira, para a linguagem de máquina, são simplesmente os princípios de engenharia que garantem esta correspondência”.

160 “Não creio que se possa chegar a uma ciência dos fenômenos complexos tentando modelar macro-variâncias observáveis [(como na inteligência artificial)]. A física, por exemplo, não é a tentativa de construir uma máquina indistinguível do mundo real no espaço interno de uma conversação. Não se deve encarar a Disneylândia [por exemplo] como um empreendimento propriamente científico”.

161 “O Roboser cria música baseado nas experiências e ‘emoções’ de um robô móvel em sua exploração do ambiente”.

162 “Redes dinâmicas-hierárquicas são representações perceptuais de processos de escuta musical, e são caracterizados por estruturas de dados organizadas e hierarquizadas compreendendo vários níveis”.

163 “É necessário dirigir o olhar para elas [(as inferências)] como mais detalhamento, porque são elas o esteio da dinâmica de toda atividade de escuta”.

164 “Podemos portanto afirmar o seguinte: até onde a música corresponder à linguagem [verbal] natural, haverá similaridades entre suas respectivas representações formais”.

165 “A idéia de que predicados verbais são vinculados a Unidades Estruturais [(em música)] é essencial para uma teoria do processamento de informação musical. Ela nos permite explicar o fato de ouvintes comunicarem-se com outros ouvintes sobre música, nos permite dar uma descrição verbal da música que escutamos”.

166 “[Para Leman], o sentido emerge quando são percebidas relações entre eventos musicais que estão embebidas nas estruturas musicais. Seu termo específico para este tipo de sentido é semântica melódica, definida como um ‘exemplo de formação de sentido a um nível não-simbólico que depende de ‘relações de similaridade sensíveis ao contexto”.

167 “Em redes que empregam unidades ocultas e um algoritmo de aprendizagem, as unidades ocultas desenvolvem representações internas dos padrões dos dados de entrada, que recodificam estes padrões de forma que permita a rede a produzir a saída correta de uma entrada de dados. Em tal arquitetura de rede, as unidades de contexto memorizam o estado interno prévio da rede. [...] Assim, as representações internas são sensíveis a um contexto temporal; o efeito do tempo está implícito nestes estados internos. Note-se entretanto, que estas representações de contextos temporais não precisam ser literais. Elas representam uma memória que é altamente dependente do estímulo e da tarefa correspondentes”.

168 “[De acordo com este ponto de vista], as representações não são símbolos abstratos, mas sim regiões de um espaço de estados possíveis. As regras não são operações sobre símbolos, mas estão ao invés disto embutidas na dinâmica do sistema, em uma dinâmica que permita o movimento de determinadas regiões enquanto torna outras transições mais difíceis. [...] Sugiro que a natureza das regras pode ser diferente do que temos imaginado que elas sejam”.

169 “As representações lingüísticas emergem como uma função do inter-relacionamento entre diversos fatores, incluindo os componentes físicos do cérebro humano que estão ativos durante o processamento lingüístico (e sua maneira característica de processamento de informação), as tarefas nas quais estes componentes estão engajados, e as características dos sinais lingüísticos a que estão expostos, particularmente em seus aspectos estatísticos. Um ponto de vista como este surgiu contemporaneamente com e parcialmente em virtude do conexionismo, que forneceu novas visões a respeito tanto da natureza da representação mental quanto das maneiras em que tais representações podem ser aprendidas”.

170 “A rede treinada aprende a identificar uma melodia com um ponto [nas possibilidades de estados] correspondente a uma primeira 'meta', outra melodia a uma segunda meta, e assim por diante para todas as melodias e metas na fase de treinamento da rede. Quando são dadas metas intermediárias (ou espúrias), a rede cria pontos novos no estado de possíveis melodias, entre as (ou além das) melodias originais. Dependendo da estrutura do espaço de melodias possíveis considerado, novas melodias diferentes serão criadas”.

171 “Freqüentemente ocorre sabermos do que gostamos sem saber exatamente o porquê. Neste caso, uma abordagem em termos de redes neurais pode ser atrativa. Podemos simplesmente mostrar à rede exemplos de ritmos bons e ruins (dizendo quais são os bons e quais os ruins), e deixá-la reproduzir mecanicamente nossos julgamentos”.

172 “Não é necessária a aplicação de nenhuma regra para a emergência destes padrões, eles simplesmente refletem a internalização de distribuições probabilísticas através da exposição prolongada a seqüências [musicais] individuais”.

173 “Quando um oscilador adaptativo é estimulado com uma periodicidade mesmo que aproximada, pode-se dizer que ele ‘representa’ uma estimativa da freqüência dos dados de entrada, e que pode ‘predizer’ alguns dos próximos pontos de sincronização (‘phase zeros’) no futuro”.

174 “Se uma pulsação métrica existe na mente dos falantes e dos ouvintes, ela não parece tomar a forma de uma descrição estática expressa em termos de frações perfeitas como as da notação musical. A métrica é um tipo de habilidade, manifestada por um mecanismo particular, um meio pelo qual o sinal é processado, guiado por tendências à periodicidade. [...] Este mecanismo se auto-organiza para descobrir e reproduzir as regularidades temporais dos dados de entrada”.

175 “A hipótese de um relógio interno diz que os sistemas cognitivos possuem um tipo de oscilador, que age como um marca-passo que fornece pulsações regulares a áreas motoras no cérebro. O que implica que todas as atividades motoras, tais como respirar, andar, mastigar e falar, devam ser reguladas por este relógio”.

176 Formantes vocálicos são as freqüências sonoras, determinadas na Fonética Experimental, que caracterizam as diferenças entre os sons da diferentes vogais das línguas humanas.

177 “Ao compreender que um projeto composicional traz uma história de interatividade entre o compositor e um sistema [musical], podemos considerar este aspecto dinâmico como o modo através do qual ele interage com o sistema. [...] O compositor pode fazer uma articulação nesta complexa estrutura [(o sistema musical]) por uma composição de observações do processo semiótico. O reconhecimento e as ambigüidades que ocorrem podem ser compostas sem uma especificação de símbolos reconhecidos universalmente, como uma referência original ou última. Novas informações podem vir a ser articuladas numa relação com os limites dos sistemas simbólicos conhecidos atualmente”.

178 “Ao invés de tentar predizer uma performance da música percussiva da tabla - uma predição feita a partir de uma suposta compreensão de todas as regras inerentes à série de procedimentos improvisatórios desta prática - [o programa] modela seus próprios processos criativos a partir de conjuntos limitados de dados. Estes dados são extraídos de performances atuais, e podem representar apenas um fragmento da ‘linguagem’ percussiva como um todo”.

179 “O processo analítico em si começa com a elaboração de proposições generalizadas, sobre a Música e sua estrutura, utilizando técnicas derivadas de uma teoria lingüística formal de origens chomskyanas. Estas proposições, apresentadas sob a forma de uma gramática gerativa/transformacional, reflete tanto a teoria musical (pro exemplo, relativa à métrica própria na qual as obras musicais são programadas, ao repertório de batidas a ser utilizado etc.) quanto um conhecimento intuitivo, não-articulado implícito nas análises das performances (combinações aceitáveis de batidas, equilíbrio entre um material fixo e um improvisado etc.). Uma vez dada como um conhecimento de base de regras formais, é uma tal gramática que modifica o comportamento do computador. (Incidentalmente, não há interação direta entre o analista e as atividades internas da máquina em si; o campo da programação é relegado a um cientista computacional)”.

180 “O modo cognitivo sugerido na discretização das teorias computacionais é formado por uma ideologia do significado denotativo (“transcendent”). Isto não significa que as teorias computacionais assumam que seus modelos do mundo real são idealmente precisos; ao invés disso, a teoria computacional assume uma relação idealizada entre seqüências de símbolos ( “nonterminal symbols”) em diferentes hierarquias, que englobam tanto a computação quanto a cognição. Essa pressuposição constitui uma ideologia“. A noção de ideologia apresenta por Choi se constitui como uma “classe de práticas de significado” ( “one class of signifying practice”), conceituação atribuída a KRISTEVA (1984; KRISTEVA 1980).

 

 

Voltar para índice.

Voltar para http://www.marcelomelloweb.cjb.net.

 

 

Topo