<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>akikoo.org &#187; University</title>
	<atom:link href="http://www.akikoo.org/log/category/edu/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.akikoo.org</link>
	<description>akikoo.org &#124; the web home of Aki Karkkainen. Published from Copenhagen, Denmark.</description>
	<lastBuildDate>Tue, 17 Aug 2010 22:55:33 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>University courses</title>
		<link>http://www.akikoo.org/log/2002/06/13/courses/</link>
		<comments>http://www.akikoo.org/log/2002/06/13/courses/#comments</comments>
		<pubDate>Thu, 13 Jun 2002 19:15:28 +0000</pubDate>
		<dc:creator>Aki Karkkainen</dc:creator>
				<category><![CDATA[University]]></category>
		<category><![CDATA[courses]]></category>
		<category><![CDATA[information systems science]]></category>
		<category><![CDATA[university]]></category>

		<guid isPermaLink="false">http://www.akikoo.org/log/2002/06/13/courses/</guid>
		<description><![CDATA[<p>This is a list of courses included in my Master of Science (Econ.) degree &#8211; 250 credit units all together.</p>]]></description>
			<content:encoded><![CDATA[<p>As a humble effort to document my life, here&#8217;s a list of courses included in my Master of Science (Econ.) degree &#8212; 250 credit units all together.<span id="more-21"></span></p>
<p>It&#8217;s just a plain list for me to remember what I&#8217;ve been studying, and maybe to show you what I&#8217;m interested in (or what I was obliged to study to finish the degree!). I&#8217;ll let you guess which subjects on this list I liked the most.</p>
<h3>Advanced studies in Information Systems Science</h3>
<ul>
<li>Basic Course in Electronic Commerce</li>
<li>Basic Course in Information Systems Development</li>
<li>Customer Behaviour in Cyber Space</li>
<li>Database Management Systems</li>
<li>Development Methods and Tools in Electronic Commerce</li>
<li>Groupware</li>
<li>Introduction to C Programming</li>
<li>Introduction to Communication Systems</li>
<li>Introduction to Networking Technology</li>
<li>Knowledge Work and its Tools</li>
<li><a href="/log/2002/06/12/thesis/">Master&#8217;s Thesis: Spatial sound in a user interface as a method to deliver hidden information and to relieve visual burden</a></li>
<li>Master&#8217;s Thesis Seminar</li>
<li>Maturity Examination</li>
<li>Object-oriented Information Systems Development</li>
<li>Operating Systems</li>
<li>Professional and Field Training</li>
<li>Research Methods</li>
<li>Seminar</li>
<li>Structured Information Systems Development</li>
<li>Systems Development Project</li>
<li>Theoretical Bases of Information Systems</li>
</ul>
<h3>Basic studies in Marketing</h3>
<ul>
<li>Basics in Marketing</li>
<li>Business to Business Marketing</li>
<li>International Marketing</li>
<li>Marketing Research and Information Systems</li>
</ul>
<h3>Basic studies in Multimedia</h3>
<ul>
<li>Constructing Multimedia Applications</li>
<li>Group Tutoring</li>
<li>Introduction to New Media</li>
<li>Multimedia Object Production</li>
<li>Multimedia Project</li>
<li>Optional Course in Multimedia</li>
</ul>
<h3>Language and Communication studies</h3>
<h4>English</h4>
<ul>
<li>Communication Skills</li>
<li>Optional Course</li>
<li>Text Workshop 1</li>
<li>Text Workshop 2</li>
</ul>
<h4>Finnish (mother tongue)</h4>
<ul>
<li>Communication and Negotiation Skills</li>
<li>Foundations of Written Communication</li>
</ul>
<h4>French</h4>
<ul>
<li>French 1</li>
<li>French 2</li>
<li>French 3</li>
<li>French 4</li>
<li>French Reading Comprehension</li>
<li>Remedial French</li>
</ul>
<h4>Swedish</h4>
<ul>
<li>Command of Swedish as the Second Language (Official Examination)</li>
<li>Optional Course</li>
</ul>
<h3>Other studies</h3>
<h4>Art History</h4>
<ul>
<li>Introduction to General Art History</li>
<li>Practical Course in Art History</li>
</ul>
<h4>Music</h4>
<ul>
<li>Arrangement</li>
<li>Big Band</li>
<li>Drums</li>
<li>History of Jazz Music</li>
<li>History of Western Art Music</li>
<li>Jazz Harmony</li>
<li>Jazz Workshop</li>
<li>Jazz Music Pedagogy</li>
<li>Piano</li>
</ul>
<h4>Philosophy</h4>
<ul>
<li>History of Philosophy 1</li>
<li>Introduction to Philosophy</li>
</ul>
<h4>Statistics</h4>
<ul>
<li>Basic Course in Statistics</li>
</ul>
<h3>General studies</h3>
<ul>
<li>Basics of Operational Research and Mathematics</li>
<li>Introduction to Scientific Research</li>
<li>Orientation to University Studies</li>
<li>Preliminary Course in Information Technology</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.akikoo.org/log/2002/06/13/courses/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Spatial sound in a user interface as a method to deliver hidden information and to relieve visual burden</title>
		<link>http://www.akikoo.org/log/2002/06/12/thesis/</link>
		<comments>http://www.akikoo.org/log/2002/06/12/thesis/#comments</comments>
		<pubDate>Wed, 12 Jun 2002 12:54:09 +0000</pubDate>
		<dc:creator>Aki Karkkainen</dc:creator>
				<category><![CDATA[University]]></category>
		<category><![CDATA[computer]]></category>
		<category><![CDATA[information]]></category>
		<category><![CDATA[interface]]></category>
		<category><![CDATA[sound]]></category>
		<category><![CDATA[Spatial]]></category>

		<guid isPermaLink="false">http://www.akikoo.org/journal/edu/2002/15</guid>
		<description><![CDATA[<span class="fi">In Finnish</span> Spatiaalinen ääni graafisessa käyttöliittymässä. Pro gradu -tutkielma Jyväskylän yliopistossa 2002.]]></description>
			<content:encoded><![CDATA[<p>Spatiaalinen ääni käyttöliittymässä piiloinformaation välittäjänä ja visuaalisen kuorman keventäjänä. <em>Tietojärjestelmätieteen pro gradu&#8211;tutkielma, 12.6.2002, Aki Kärkkäinen.</em> Jyväskylän yliopisto, Tietojenkäsittelytieteiden laitos, Jyväskylä.</p>
<p><span id="more-15"></span></p>
<h3>Sisällysluettelo</h3>
<ul class="thesisNav">
<li id="toc-abstract"><a title="Tiivistelmä" href="#abstract">Tiivistelmä</a></li>
<li id="toc-acknowledgements"><a title="Kiitokset" href="#acknowledgements">Kiitokset</a></li>
<li id="toc-1"><a title="Johdanto" href="#ch-1">1.Johdanto</a>
<ul class="thesisNav">
<li id="toc-1_1"><a title="Tutkimuksen taustaa" href="#ch-1_1">1.1 Tutkimuksen taustaa</a></li>
<li id="toc-1_2"><a title="Tutkimustehtävä" href="#ch-1_2">1.2 Tutkimustehtävä</a></li>
<li id="toc-1_3"><a title="Sovellettavat tieteenalat ja tutkimuksen rakenne" href="#ch-1_3">1.3 Sovellettavat tieteenalat ja tutkimuksen rakenne</a></li>
</ul>
</li>
<li id="toc-2"><a title="Kuuntelemalla tietoa maailmasta" href="#ch-2">2. Kuuntelemalla tietoa maailmasta</a>
<ul class="thesisNav">
<li id="toc-2_1"><a title="Ääni ja sen eteneminen korvaan" href="#ch-2_1">2.1 Ääni ja sen eteneminen korvaan</a></li>
<li id="toc-2_2"><a title="Äänten ryhmittely" href="#ch-2_2">2.2 Äänten ryhmittely</a></li>
<li id="toc-2_3"><a title="Aistihavaintojärjestelmät" href="#ch-2_3">2.3 Aistihavaintojärjestelmät</a></li>
<li id="toc-2_4"><a title="Audiovisuaalinen sopimus" href="#ch-2_4">2.4 Audiovisuaalinen sopimus</a></li>
<li id="toc-2_5"><a title="Jokapäiväinen ja musiikillinen kuuntelu" href="#ch-2_5">2.5 Jokapäiväinen ja musiikillinen kuuntelu</a></li>
<li id="toc-2_6"><a title="Syntaktiset ja semanttiset tekijät äänten tunnistamisessa" href="#ch-2_6">2.6 Syntaktiset ja semanttiset tekijät äänten tunnistamisessa</a></li>
</ul>
</li>
<li id="toc-3"><a title="Spatiaalinen ääni" href="#ch-3">3 Spatiaalinen ääni</a>
<ul class="thesisNav">
<li id="toc-3_1"><a title="Äänen paikantaminen" href="#ch-3_1">3.1 Äänen paikantaminen</a></li>
<li id="toc-3_2"><a title="Siirtofunktio" href="#ch-3_2">3.2 Siirtofunktio</a></li>
<li id="toc-3_3"><a title="Äänen synteettinen spatialisointi" href="#ch-3_3">3.3 Äänen synteettinen spatialisointi</a></li>
<li id="toc-3_4"><a title="Auralisaatio" href="#ch-3_4">3.4 Auralisaatio</a></li>
<li id="toc-3_5"><a title="Kaiutin- ja kuulokeäänentoiston vastakkainasettelu" href="#ch-3_5">3.5 Kaiutin- ja kuulokeäänentoiston vastakkainasettelu</a></li>
<li id="toc-3_6"><a title="Äänen spatialisoinnin ongelmat" href="#ch-3_6">3.6 Äänen spatialisoinnin ongelmat</a></li>
<li id="toc-3_7"><a title="Spatiaalista ääntä hyödyntäviä sovelluksia" href="#ch-3_7">3.7 Spatiaalista ääntä hyödyntäviä sovelluksia</a></li>
</ul>
</li>
<li id="toc-4"><a title="Äänimaisema-analyysi käyttöliittymässä" href="#ch-4">4. Äänimaisema-analyysi käyttöliittymässä</a>
<ul class="thesisNav">
<li id="toc-4_1"><a title="Hiljaisuus" href="#ch-4_1">4.1 Hiljaisuus</a></li>
<li id="toc-4_2"><a title="Äänen käyttötarkoitus" href="#ch-4_2">4.2 Äänen käyttötarkoitus</a></li>
<li id="toc-4_3"><a title="Ikoniset äänet" href="#ch-4_3">4.3 Ikoniset äänet</a></li>
<li id="toc-4_4"><a title="Symboliset äänet" href="#ch-4_4">4.4 Symboliset äänet</a></li>
<li id="toc-4_5"><a title="Metaforiset äänet" href="#ch-4_5">4.5 Metaforiset äänet</a></li>
<li id="toc-4_6"><a title="Äänitapahtumien luokittelujärjestelmät" href="#ch-4_6">4.6 Äänitapahtumien luokittelujärjestelmät</a></li>
</ul>
</li>
<li id="toc-5"><a title="Keskustelua" href="#ch-5">5. Keskustelua</a>
<ul class="thesisNav">
<li id="toc-5_1"><a title="Tulokset" href="#ch-5_1">5.1 Tulokset</a></li>
<li id="toc-5_2"><a title="Johtopäätökset" href="#ch-5_2">5.2 Johtopäätökset</a></li>
</ul>
</li>
<li id="toc-6"><a title="Yhteenveto" href="#ch-6">6. Yhteenveto</a></li>
<li id="toc-refs"><a title="Lähteet" href="#refs">Lähteet</a></li>
<li>Kuviot
<ul>
<li>KUVIO 1. Objektin äänellinen ja visuaalinen esitys</li>
<li>KUVIO 2. Binauraalinen äänitys ja toisto</li>
<li>KUVIO 3. Siirtofunktioiden  mittaus ja simulointi</li>
</ul>
</li>
<li>Taulukot
<ul>
<li>TAULUKKO 1. Äänitutkimuksen kategoriat</li>
<li>TAULUKKO 2. Tutkimuksen tulokset</li>
</ul>
</li>
</ul>
<div id="abstract">
<h3>Tiivistelmä <a title="takaisin sisällysluetteloon" href="#toc-abstract">^</a></h3>
<p>Tutkimuksessa tarkastellaan spatiaalista ääntä graafisen käyttöliittymän laajentajana. Tavoitteena on tutkia, miten ääntä voitaisiin käyttää grafiikan kanssa piiloinformaation välittämisessä. Käsitteellis-teoreettisen analyysin avulla pyritään sijoittamaan keskeiset käsitteet laajempaan viitekehykseen.</p>
<p>Tutkimuksessa tarkastellaan ensin kuuntelemiseen ja äänen paikantamiseen liittyviä seikkoja, jonka jälkeen esitetään synteettisen spatialisoinnin periaate ja sen toteutukseen liittyvät ongelmat. Tämän jälkeen spatiaalista ääntä tarkastellaan käyttöliittymäkontekstissa semioottisessa viitekehyksessä.</p>
<p>Tulokset osoittavat, että spatiaalisia &#8212; syntaksia noudattavia &#8212; jokapäiväisiä äänitapahtumia voidaan liittää käyttöliittymän tehtäviin ja objekteihin paljastamalla siten muutoin piiloon jäävää informaatiota. Jatkotutkimusaiheita on runsaasti psykoakustiikan, käytännön sovellusten ja akustisen ekologian piirissä. Erityisesti liikkuvan tietojenkäsittelyn pienikokoisissa laitteissa äänen merkitys korostunee tulevaisuudessa, visuaalisen informaation määrän supistuessa.</p>
<p>AVAINSANAT:    akustinen ekologia, auralisaatio, käyttöliittymä, piiloinformaatio, psykoakustiikka, spatialisointi, äänen paikantaminen, ikoninen ääni</p>
</div>
<div id="acknowledgements">
<h3>Kiitokset <a title="takaisin sisällysluetteloon" href="#toc-acknowledgements">^</a></h3>
<p>Kiitän seuraavia henkilöitä ja laitoksia, joita ilman tämä työ ei olisi syntynyt (tai ainakin sen tekeminen olisi ollut paljon tylsempää):</p>
<p>Jyväskylässä työn tarkastajat Seppo Puuronen ja Kai Tuuri, Jyväskylän yliopisto, opiskelijavaihdon järjestäjä Leena Uski, Panu Varstala, Henna Välikangas, Isä ja Äiti.</p>
<p>Pariisissa XYZ-yhteisön suuret säätäjät Tauri Kankaanpää ja Juha Oravala, vuokraisännät Gilles Martin ja Wolfgang Kukulies, yleinen tuki ja turva Laëtitia Kulyk, Montmartren kämppäkaverit Bettina Ortmann ja Mariné Pereira, janoisen kirjoittajan virkistävät keitaat Ed, Leaderprice ja Monoprix, kannettava kirjoituskone HyperBook 2300SLC/486 (&#8220;piip!&#8221;), multimedian mekka Centre Pompidou, Cité des Sciences et de l&#8217;Industrie (La Villette), IRCAM (Institut de Recherche et Coordination Acoustique/Musique), M.S.COM Espace Internet (&#8220;Quinze minutes, s&#8217;il vous plaît!&#8221;), Université de la Sorbonne nouvelle Paris III (Cinéma et Audiovisuel).</p>
</div>
<div id="ch-1">
<h3>1. Johdanto <a title="takaisin sisällysluetteloon" href="#toc-1">^</a></h3>
<p>Luvussa esitellään ensin aihepiiri ja sen rajaukset, jonka jälkeen määritellään tutkimusongelma sekä eri tieteenalojen osuus tutkimuksessa.</p>
</div>
<div id="ch-1_1">
<h4>1.1 Tutkimuksen taustaa <a title="takaisin sisällysluetteloon" href="#toc-1_1">^</a></h4>
<p>Miksi ääntä pitäisi käyttää käyttöliittymässä? Onko ääni vain turha ja irrallinen elementti, joka häiritsee keskittymistä tehtävään? Tällaisia kysymyksiä esitetään yleensä silloin, kun äänisuunnittelu on tehty puutteellisesti tai kun sitä ei osata tehdä. Vaikka kuulolla koettu ilmiö edustaa fenomenologisesti yhtä varmaa tietoa kuin näöllä koettu, nähtyä pidetään objektiivisena ja kuultua subjektiivisena tietona<sup id="ref-54_0" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 13)">[54]</a></sup>. Äänen hyödyntäminen graafisissa käyttöliittymissä onkin toistaiseksi jäänyt todella vähäiseksi. Grafiikkaa ja ääntä on kuitenkin käytännössä vaikea erottaa toisistaan. Niiden tulisikin tukea ja täydentää toisiaan siten, ettei kumpikaan ole täydellinen ilman toista.</p>
<p>Mikä sitten voisi olla äänen tuottama lisäarvo graafisessa käyttöliittymässä? Chionin<sup id="ref-33_0" class="ref"><a href="#note-33" title="(Chion 1990, 5)">[33]</a></sup> mukaan ääni rikastuttaa kuvaa antamalla vaikutelman, että ääni on &#8220;turha&#8221;, samaan aikaan kun ääni tuo esille ja voimistaa sen, mitä kuvassa jo on (mutta joka ei tulisi esille ilman ääntä!). Vaikka Chion puhuu yksinomaan elokuvasta, näkökulma on silti mielenkiintoinen ja sovellettavissa käyttöliittymään: se sisältää ajatuksen, että ääni voi olla informatiivinen ja ekspressiivinen olematta silti häiritsevä. Ääni on kuulunut elokuvaan jo 70 vuotta<sup id="ref-33_1" class="ref"><a href="#note-33" title="(Chion 1990, 142)">[33]</a></sup>, miksei tämä kehitys kuuluisi myös käyttöliittymissä?</p>
<p>Ääntä on perinteisesti käytetty käyttöliittymässä varoitus- tai ilmoitusmerkityksessä tai tunnelman luomisessa (lähinnä pelit ja multimediasovellukset). Äänen tarkoituksena on ollut myös auttaa näkövammaisia työskentelemään tietokoneen kanssa. Ajatus on luonnollinen sikäli, että käytetäänhän grafiikkaakin vain näkeviä ihmisiä varten. Tällainen näkökulma on kuitenkin liian rajoittunut. Tuntuu keinotekoiselta ajatella, että näkevät ihmiset käyttäisivät graafista käyttöliittymää ja näkövammaiset kuulokäyttöliittymää. Käsite kuulokäyttöliittymä on &#8212; toisin kuin graafinen tai merkkipohjainen käyttöliittymä &#8212; vielä verraten harvinainen.</p>
<p>Kuulokäyttöliittymätutkimus on perinteisesti jakautunut kahteen tutkimushaaraan: graafisen käyttöliittymän laajentamiseen äänen avulla (auditory interface, auditory display) ja näkövammaisille tarkoitettuun, graafisen käyttöliittymän korvaavaan kuulokäyttöliittymään (audio-only interface, nonvisual interface). Käsitteet menevät osittain päällekkäin; joskus auditory interface saattaa viitata myös näkövammaisille tarkoitettuun käyttöliittymään (ks. Edwards<sup id="ref-38_0" class="ref"><a href="#note-38" title="(Edwards 1988)">[38]</a></sup>. Pääasia on, että käsitteillä viitataan informaation esittämiseen käyttöliittymässä äänen avulla.</p>
<p>Ensin täytyy kuitenkin selvittää, minkälaisia ääniä käytetään. Tässä tutkimuksessa keskitytään synteettisiin tai luonnollisiin ei-puheääniin, koska puheääni on (a) hidasta, (b) ärsyttävää kuunnella ja (c) liian huomiota vaativaa. Informaatiota voi jäädä piiloon (hidden information) esimerkiksi siksi, että näyttöön on ahdettu liikaa visuaalista informaatiota<sup id="ref-16_0" class="ref"><a href="#note-16" title="(Blattner, Papp III &amp; Glinert 1994, 448)">[16]</a></sup>. Cohenin<sup id="ref-35_0" class="ref"><a href="#note-35" title="(Cohen 1994, 500)">[35]</a></sup> mielestä tietokoneen näyttö ei yksinkertaisesti ole tarpeeksi suuri kyetäkseen näyttämään visuaalisesti kaikki käynnissä olevat toiminnot. Suuri osa näistä toiminnoista tapahtuu käyttäjä &#8220;selän takana&#8221;, oli sitten kyseessä käyttäjän alullepanema toiminto tai jokin käyttäjää kohti suuntautuva toiminto.<sup id="ref-35_1" class="ref"><a href="#note-35" title="(Cohen 1994, 500)">[35]</a></sup>.</p>
<p>Ensiksi mainittu tutkimushaara (graafisen käyttöliittymän laajentaminen) jakaantuu kolmeen pääsuuntaukseen: <em>ikonisiin ääniin</em> (auditory icons), <em>symbolisiin ääniin</em> (earcons) ja <em>sonifikaatioon</em> (sonification). Ikoniset äänet perustuvat jokapäiväisen kuuntelun tuottamaan informaatioon<sup id="ref-42_0" class="ref"><a href="#note-42" title="(Gaver 1986, 168)">[42]</a></sup>. Symboliset äänet ovat abstrakteja, synteettisiä ääniä, joita voidaan käyttää strukturoidusti äänellisten viestien esittämiseen käyttöliittymässä<sup id="ref-22_0" class="ref"><a href="#note-22" title="(Brewster, Wright &amp; Edwards 1993, 222)">[22]</a></sup>. Sonifikaatio tarkoittaa ohjelmien tuottaman tiedon esittämistä äänen avulla<sup id="ref-51_0" class="ref"><a href="#note-51" title="(Hereford &amp; Winn 1994, 219)">[51]</a></sup>.</p>
<p>Herefordin ja Winnin<sup id="ref-51_1" class="ref"><a href="#note-51" title="(Hereford ja Winn 1994, 212--213)">[51]</a></sup> mukaan äänellä on käyttöliittymässä kaksi funktiota: ääni (a) kertoo käyttäjälle järjestelmän tilasta kullakin hetkellä hälytysäänillä tai &#8220;tarkkailee&#8221; taustalla kunnes käyttäjä vaatii tietoa järjestelmän tilasta ja (b) välittää ohjelmien tuottamaa tietoa. Hereford ja Winn<sup id="ref-51_2" class="ref"><a href="#note-51" title="(Hereford ja Winn 1994, 213)">[51]</a></sup> luokittelevat ikoniset ja symboliset äänet ryhmään (a) ja sonifikaation ryhmään (b). Sonifikaatio sivuutetaan tässä tutkimuksessa. Jälkimmäinen tutkimushaara (näkövammaisille tarkoitetun käyttöliittymän tutkimus) rajataan myöskin tämän tutkimuksen ulkopuolelle. Aihepiiriä ovat lähestyneet ainakin Edwards<sup id="ref-38_1" class="ref"><a href="#note-38" title="(Edwards 1988)">[38]</a></sup>, Mynatt ja Weber<sup id="ref-65" class="ref"><a href="#note-65" title="(Mynatt ja Weber 1994)">[65]</a></sup> sekä Mereu ja Kazman<sup id="ref-64" class="ref"><a href="#note-64" title="(Mereu ja Kazman 1996)">[64]</a></sup>.</p>
<p>Ihmisen ja koneen vuorovaikutusta tarkasteltaessa tulisi käyttää sateenkaarikäsitettä käyttöliittymä, johon on integroitu useita toisiaan tukevia modaliteetteja. Modaliteetilla viitataan tässä yhteydessä Dannenbergin ja Blattnerin<sup id="ref-36" class="ref"><a href="#note-36" title="(Dannenberg ja Blattner 1992, xxiii)">[36]</a></sup> mukaisesti siihen aistiin, jolla informaatio havaitaan. Brownin, Newsomen ja Glinertin<sup id="ref-27_0" class="ref"><a href="#note-27" title="(Brown, Newsome ja Glinert 1989, 339)">[27]</a></sup> mukaan visuaalisen informaation liiallinen määrä voi laskea tehokkuutta tehtävän suorituksessa. Jakamalla informaatiota useille eri aisteille voidaan näköaistin ylikuormitusta lievittää.<sup id="ref-27_1" class="ref"><a href="#note-27" title="(Brown ym. 1989, 339)">[27]</a></sup>. Huomioitavaa on silti se, että vaikka lähes kaikki käyttöliittymät ovatkin nykyään multimediakäyttöliittymiä, ne eivät silti ole multimodaalisia, koska hyödyntävät vain grafiikkaa<sup id="ref-21_0" class="ref"><a href="#note-21" title="(Brewster 1994, 8)">[21]</a></sup>. Laitteisto on jo valmiina, kunhan vain tiedettäisiin mitä sillä pitäisi tehdä.</p>
<p>Tässä tutkimuksessa käyttöliittymää tarkastellaan yleisellä tasolla, ei laite- tai järjestelmätasolla (vrt. esimerkiksi Brewster, Leplatre &amp; Crease<sup id="ref-25_0" class="ref"><a href="#note-25" title="(Brewster, Leplatre &amp; Crease (1998))">[25]</a></sup>, jotka ovat tutkineet äänen käyttöä liikkuvan tietojenkäsittelyn sovelluksissa). Käyttäjän oletetaan kommunikoivan koneen kanssa perinteisesti näppäimistön ja hiiren (tai muun osoittimen) avulla (input) ja saavan palautetta äänen avulla (output), Brewsterin<sup id="ref-20" class="ref"><a href="#note-20" title="(Brewster 1991, 18)">[20]</a></sup> tapaan. Näin aihetta voidaan tarkastella poikkitieteellisesti, pääpainon ollessa ihmisen ja tietokoneen vuorovaikutuksessa. Vuorovaikutuksen onnistuminen riippuu paljolti siitä, saako ihminen koneen tekemään halutun tehtävän pienimmällä mahdollisella käytön opettelemisella<sup id="ref-51_3" class="ref"><a href="#note-51" title="(Hereford &amp; Winn 1994, 212--213)">[51]</a></sup>. Tutkimuksessa ei käsitellä äänen käyttöä jaetuissa työtiloissa tai tietokoneavusteisessa ryhmätyössä (ks. Ackerman, Starr, Hindus &amp; Mainwaring<sup id="ref-1" class="ref"><a href="#note-1" title="(Ackerman, Starr, Hindus &amp; Mainwaring 1997)">[1]</a></sup>.</p>
<p>Koska vuorovaikutuksen täytyy käyttöliittymässä olla nopeaa, äänten täytyy (a) olla lyhyitä ja (b) soida samanaikaisesti (toisin kuin peleissä tai elokuvissa, joissa immersiivisyys on tärkeämpää kuin tehokkuus; nämä eivät kuitenkaan välttämättä sulje toisiaan pois). Toisaalta Kramerin<sup id="ref-60_0" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup> mukaan ääni voi myös olla pitkä, jos sen tarkoituksena on välittää informaatiota taustaprosessista. Oli kyseessä sitten jääkaapin hurina, liikenne tai linnunlaulu, mukaudumme pysyviin, staattisiin äänielementteihin. Kuulemme yksittäiset äänet vasta keskityttyämme niihin tietoisesti tai kun ne vaativat  huomiotamme yhtäkkisen muutoksen kautta.<sup id="ref-60_1" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup>.</p>
<p>Ihmisellä on kyky erotella ja sijoittaa äänet tietyistä suunnista tuleviksi<sup id="ref-5" class="ref"><a href="#note-5" title="(Arons 1992, 35)">[5]</a></sup>. Tämä ns. cocktail party effect (kyky valita yksi äänivirta useista samanaikaisista äänivirroista<sup id="ref-48_0" class="ref"><a href="#note-48" title="(Gibson 1966, 84)">[48]</a></sup>) mahdollistaa äänten spatiaalisen sijoittelun käyttöliittymässä. Samalla tavalla kuin voimme näköaistin avulla havaita useita visuaalisia objekteja samanaikaisesti, voimme spatiaalisesti kuulla useita eri ääniobjekteja samanaikaisesti ja keskittyä johonkin niistä. <em>Spatialisaatiossa</em> luodaan synteettisesti kolmiulotteinen äänikenttä, jossa äänet tuntuvat tulevan tietyistä paikallistettavista suunnista kuulijan pään ulkopuolelta<sup id="ref-50_0" class="ref"><a href="#note-50" title="(Goose &amp; Möller 1999, 363)">[50]</a></sup>. <em>Auralisaatio</em> taas tarkoittaa prosessia, jonka tarkoituksena on luoda jokin kolmiulotteinen virtuaalitila &#8212; joko sisä- tai ulkotilassa &#8212; simuloimalla äänilähteiden suuntaa ja huonekaikua<sup id="ref-13_0" class="ref"><a href="#note-13" title="(Begault 1994, 145)">[13]</a></sup>. Käytännössä nämä kaksi käsitettä ovat hyvin lähellä toisiaan. Tässä tutkimuksessa auralisaatiolla tarkoitetaan koko virtuaalisen kuuloympäristön luontiprosessia, spatialisaation viitatessa enemminkin signaalinprosessointitekniikkaan.</p>
<p>Visuaalisia objekteja voidaan sijoittaa näytölle värien avulla, jolloin objektit erottuvat nopeammin toisistaan<sup id="ref-32" class="ref"><a href="#note-32" title="(Carter 1982, 127)">[32]</a></sup>. Ääniobjektien (-tapahtumien) käytössä ja sijoittelussa sen sijaan on käytetty lähinnä ad hoc&#8211;menetelmiä riippuen käytettävästä laitteistosta, ohjelmistosta ja sovelluksen luonteesta. Ennen ääniobjektien sijoittelua tilassa täytyy käytettäville äänille luoda luokittelujärjestelmä, jonka tarkoituksena on antaa merkitys kullekin äänelle ja sen sijainnille tilassa.</p>
</div>
<div id="ch-1_2">
<h4>1.2 Tutkimustehtävä <a title="takaisin sisällysluetteloon" href="#toc-1_2">^</a></h4>
<p>Aiemmissa tutkimustuloksissa esitetyt strukturoidut menetelmät äänen käytölle eivät ole olleet riittäviä, koska kukin näistä menetelmistä on keskittynyt vain johonkin kapeaan osa-alueeseen. TAULUKOSSA 1 on esitetty yleisen äänitutkimuksen kategoriat Schaferin<sup id="ref-71_0" class="ref"><a href="#note-71" title="(Schafer 1977, 148)">[71]</a></sup> mukaan. Kendall<sup id="ref-57_0" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup> lisää edelliseen vielä neuropsykologian, jossa tutkitaan kuulokokemuksen neurologisia rakenteita. Se, samoin kuin akustiikka ja äänen estetiikka kuuluvat tämän tutkimuksen ulkopuolelle (sikäli kuin näin tarkkoja rajauksia voi edes tehdä). Schafer<sup id="ref-71_1" class="ref"><a href="#note-71" title="(Schafer 1977)">[71]</a></sup> on tehnyt akustisen äänimaiseman tutkimusta (soundscape), joka liittyy läheisesti myös akustiseen ekologiaan (acoustic ecology) (vrt. Gaver<sup id="ref-44_0" class="ref"><a href="#note-44" title="(Gaver 1993a)">[44]</a></sup><sup id="ref-46_0" class="ref"><a href="#note-46" title="(Gaver 1993c)">[46]</a></sup>).</p>
<table id="table-1" summary="Äänitutkimuksen kategoriat Schaferin (1977) mukaan">
<caption>TAULUKKO 1. Äänitutkimuksen kategoriat <a title="takaisin sisällysluetteloon" href="#toc-table_1">^</a></caption>
<colgroup>
<col class="areaCol" />
<col class="personCol" />
<col class="issueCol" /></colgroup>
<thead>
<tr>
<th scope="col">Alue</th>
<th scope="col">Tutkija</th>
<th scope="col">Tutkimusongelma</th>
</tr>
</thead>
<tbody>
<tr class="odd">
<td>Äänen akustiikka</td>
<td>fyysikko, insinööri</td>
<td>Mitä äänet ovat?</td>
</tr>
<tr>
<td>Äänen psykoakustiikka</td>
<td>psykologi, fysiologi, kognitiotieteilijä</td>
<td>Miten äänet havaitaan?</td>
</tr>
<tr class="odd">
<td>Äänen semantiikka</td>
<td>kielitieteilijä, viestintätieteilijä</td>
<td>Mitä äänet tarkoittavat?</td>
</tr>
<tr>
<td>Äänen estetiikka</td>
<td>säveltäjä, musiikkitieteilijä</td>
<td>Miltä äänet tuntuvat?</td>
</tr>
</tbody>
</table>
<p>Schafer<sup id="ref-71_2" class="ref"><a href="#note-71" title="(Schafer 1977, 205)">[71]</a></sup> määrittelee akustisen ekologian tutkimusalaksi, jossa tarkastellaan äänimaiseman akustisten ilmiöiden suhdetta ja vaikutusta siinä elävien olentojen käyttäytymiseen. Määritelmän perusteella akustinen ekologia on täysin sovellettavissa käyttöliittymään, joka muodostaa oman vuorovaikutteisen äänimaisemansa.</p>
<p>Tämän tutkimuksen pääpaino sijoittuu pääasiassa psykoakustiikan, semiotiikan ja akustisen ekologian välimaastoon, jolloin saadaan toisaalta tietoa kuulokokemuksesta psyykkisenä prosessina, ja toisaalta tietoa ääniobjektien ominaisuuksista, sijainnista ja merkityksistä ympäröivässä maailmassa. Tämän jälkeen merkitykset voidaan liittää käyttöliittymäkontekstiin.</p>
<p>Keskeiseksi ongelmaksi muodostuu se, miten ääni voitaisiin integroida grafiikan kanssa. Äänen tulisi tukea tavoitteellista toimintaa, immersiivisyys voi käyttöliittymässä tulla kyseeseen vasta toiminnallisuuden varmistamisen jälkeen. Tavoitteena on löytää akustisesta ääniympäristöstämme hyödyllisiä spatiaalisia metaforia ja ikonisia ääniä piilossa olevan informaation organisoimiseen ja esittämiseen käyttöliittymässä yhdessä näköaistin välittämän informaation kanssa.</p>
<p>Kirjallisuuden pohjalta on tarkoitus koota yhteen äänitutkimukseen liittyviä käsitteitä ja teoreettisia viitekehyksiä. Tämän jälkeen käsitteitä tarkastellaan laajemmassa semioottisessa ja akustisen ekologian viitekehyksessä. Aihe on vaikea, koska yleistysten teko on hankalaa johtuen ihmisten kulttuuritaustoista sekä erilaisista äänen havainnointi- ja paikantamistaidoista. Aihetta tarkastellaan tässä tutkimuksessa normaalin näön omaavien keskivertokäyttäjien ja -havainnoijien näkökulmasta. Edellisen perusteella <em>tutkimusongelma muodostuu seuraavasta kahdesta osaongelmasta:</em></p>
<ol>
<li>Miten spatiaalista ääntä voitaisiin käyttää yhdessä grafiikan kanssa piilossa olevien objektien tai tapahtumien esittämisessä, tehtävän suorituksessa ja merkityksenannossa?</li>
<li>Voidaanko sellaista spatiaalista ääntä, joka ei selvästi viittaa käyttöliittymän tapahtumiin tai objekteihin, käyttää piiloinformaation välittämisessä?</li>
</ol>
<p>Tutkimus jakaantuu siten kahteen pääteemaan: (a) spatiaalisen äänen tuottamaan merkityssisältöön ja (b) ympäristön spatiaalisten äänten hyödyntämiseen ja liittämiseen käyttöliittymän objekteihin. Taustaolettamuksena ovat kuuloaistin funktiot Gibsonin<sup id="ref-48_1" class="ref"><a href="#note-48" title="(Gibson 1966, 75)">[48]</a></sup> mukaan: äänen suunnan havaitseminen ja äänilähteen tunnistaminen. Vaikka kyseessä on teoreettinen tutkimus, tutkimustulosten odotetaan hyödyttävän käyttöliittymäsuunnittelijoita myös käytännössä. Äänellinen käyttöliittymäsuunnittelu on aloitettava ihmisestä käsin, ja edettävä vasta sitten tekniseen toteutukseen. Tutkimuksen hyödyllisimpänä puolena lienee se, että siinä pyritään kattamaan laajempi alue kuin aiemmissa tutkimuksissa &#8212; joskin verraten yleisellä tasolla &#8212; ja luomaan laajennettu viitekehys spatiaalisen äänen informaation välittämistä ja tavoitteellista toimintaa tukevasta käytöstä käyttöliittymässä.</p>
</div>
<div id="ch-1_3">
<h4>1.3 Sovellettavat tieteenalat ja tutkimuksen rakenne<a title="takaisin sisällysluetteloon" href="#toc-1_3">^</a></h4>
<p>Tutkimuksessa käytetään kirjallisuutta soveltuvin osin akustisesta ekologiasta, kognitiivisesta psykologiasta ja viestintätieteistä. Viestintätieteiden osalta tutkimuksessa käytetään Fisken<sup id="ref-40_0" class="ref"><a href="#note-40" title="(Fiske 2000)">[40]</a></sup> esittämää jakoa prosessikoulukuntaan ja semioottiseen koulukuntaan. Vaikka Fiske jakaa viestintätieteiden teoriat edellämainittuihin koulukuntiin, niiden välinen raja on usein häilyvä. Prosessikoulukunnan mukaan viestintä on sanomien siirtoa ja jos vaikutus eroaa tarkoitetusta, viestintä on epäonnistunut. Tällöin käydään läpi viestinnän eri vaiheita vian löytämiseksi.</p>
<p>Semioottisen koulukunnan mukaan viestintä taas on merkitysten tuottamista ja vaihtoa. Tärkeää on se, kuinka sanomat (useimmiten tekstit, tässä yhteydessä äänet) ja ihmiset toimivat vuorovaikutuksessa tuottaakseen merkityksiä. Väärinkäsitykset eivät välttämättä todista viestinnän epäonnistuneen, vaan ne saattavat johtua lähettäjän ja vastaanottajan kulttuurieroista.<sup id="ref-40_1" class="ref"><a href="#note-40" title="(Fiske 2000, 14--15)">[40]</a></sup>. Pääpaino tässä tutkimuksessa on semioottisessa lähestymistavassa. Kognitiotieteiden osalta keskitytään muistin asettamiin rajoituksiin sekä seriaaliin ja paralleeliin tiedonkäsittelyyn.</p>
<p>Tutkimus etenee seuraavasti: <a title="Luku 2" href="#ch-2">Luvussa 2</a> perehdytään siihen, miten kuuloaistin avulla saadaan tietoa maailmasta sekä verrataan kuulo- ja näköaistia keskenään. <a title="Luku 3" href="#ch-3">Luvussa 3</a> tarkastellaan niitä tekijöitä, joiden perusteella ääni paikannetaan tietystä suunnasta tulevaksi sekä esitetään synteettisen spatialisoinnin periaate ja toteutukseen liittyvät ongelmat. <a title="Luku 4" href="#ch-4">Luvussa 4</a> analysoidaan spatiaalista äänimaisemaa käyttöliittymäkontekstissa. <a title="Luku 5" href="#ch-5">Luvussa 5</a> kootaan yhteen tutkimuksen keskeiset tulokset ja verrataan niitä aiempiin tutkimuksiin. Lopuksi <a title="Yhteenveto" href="#ch-6">yhteenvedossa</a> pohditaan jatkotutkimusaiheita.</p>
</div>
<div id="ch-2">
<h3>2. Kuuntelemalla tietoa maailmasta <a title="takaisin sisällysluetteloon" href="#toc-2">^</a></h3>
<p>Tässä luvussa tarkastellaan, miten saamme kuuntelemalla tietoa maailmasta yhdistämällä tätä tietoa aiempiin kokemuksiimme. Luku on synteesi kuuntelemisen psykoakustisista, havainnollisista, syntaktisista ja semanttisista tekijöistä, ja samalla perustelu semioottiselle lähestymistavalle.</p>
</div>
<div id="ch-2_1">
<h4>2.1 Ääni ja sen eteneminen korvaan <a title="takaisin sisällysluetteloon" href="#toc-2_1">^</a></h4>
<p>Ääni on sekä semanttinen että fysikaalinen käsite<sup id="ref-11_0" class="ref"><a href="#note-11" title="(Beaudouin--Lafon &amp; Gaver 1994, 49--50)">[11]</a></sup>. Äänen akustisia piirteitä kuvataan fysikaalisilla suureilla (kuten taajuudella), kun taas elämyksellinen äänimaailma muodostuu lukuisista äänielämyksiin liittyvistä piirteistä<sup id="ref-54_1" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 15)">[54]</a></sup>. Jauhiaisen<sup id="ref-54_2" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 26--27)">[54]</a></sup> mukaan <em>ääni fysikaalisena käsitteenä</em> on äänilähteestä pallomaisesti kaikkiin suuntiin etenevää molekyylien värähtelyä, joka etenee väliaineessa aaltomaisina tihentymä- ja harventumavaiheina. Eri aineiden rajapintoja kohdatessaan ääni <q>osittain heijastuu, osittain imeytyy toiseen aineeseen, absorboituu ja jatkaa kulkuaan toisessa aineessa</q><sup id="ref-54_3" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 37)">[54]</a></sup>.</p>
<p>Äänen aaltoliikettä kuvataan aallonpituudella, taajuudella ja amplitudilla. Jauhiaisen<sup id="ref-54_4" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 26--27)">[54]</a></sup> mukaan <em>aallonpituus</em> on etäisyys ääniaallon tihentymisvaiheesta toiseen, ja <em>taajuus</em> (frequency, yksikkönä hertsi, Hz) ilmoittaa värähdysten lukumäärän sekunnissa kuvaten äänen korkeutta. <em>Amplitudi</em> tarkoittaa värähtelyn laajuutta eli poikkeamaa keskiarvosta ja ilmaisee siten äänen voimakkuutta. <em>Äänes</em> eli <em>puhdas ääni</em> tarkoittaa ääntä, joka sisältää vain yhden taajuuden.<sup id="ref-54_5" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 26--27)">[54]</a></sup>. Gibsonin<sup id="ref-48_2" class="ref"><a href="#note-48" title="(Gibson 1966, 87)">[48]</a></sup> mielestä tällainen puhdas ääni aiheuttaa vain merkityksettömän aistimuksen. Merkitykselliset äänet koostuvat hänen mukaansa paljon monimutkaisemmista variaatioista. Jauhiainen<sup id="ref-54_6" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 26--27)">[54]</a></sup> huomauttaa, että käytännössä kaikki ympäristössä kuulemamme äänet koostuvat useasta samanaikaisesta eri taajuisesta värähtelystä. Tällaista ääntä kutsutaan seosääneksi, jonka taajuussisällön kuvausta kutsutaan äänen <em>spektriksi</em>. Spektri sisältää siis äänen perustaajuuden ja sen harmoniset osaäänekset kullakin hetkellä.<sup id="ref-54_7" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 26--27)">[54]</a></sup><sup id="ref-49_0" class="ref"><a href="#note-49" title="(Goldstein 1999, 312--313)">[49]</a></sup>. Ääni voi olla jokin luonnollinen akustisen ilmiön ääni tai koneellisesti aikaansaatu, synteettinen ääni<sup id="ref-53_0" class="ref"><a href="#note-53" title="(Huopaniemi 1999, 43--44)">[53]</a></sup>. Ääni etenee kuulijan korvaan sekä suoraan että heijastuen seinistä, lattioista ja katosta tai huonekaluista<sup id="ref-54_8" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 38)">[54]</a></sup>. Ääniaallot saavuttavat ensin korvalehden, joka ohjaa aallot korvakäytävän kautta tärykalvolle ja edelleen syvemmälle kuuloelimiin<sup id="ref-54_9" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 43--44)">[54]</a></sup>. <em>Ääni elämyksellisenä käsitteenä</em> sen sijaan koostuu neljästä peruspiirteestä:</p>
<ul>
<li>äänen voimakkuudesta kvantitatiivisena ominaisuutena (loudness)</li>
<li>äänen korkeudesta kvalitatiivisena ominaisuutena (pitch)</li>
<li>äänen ajallisuus- ja paikallisuusominaisuuksista.</li>
</ul>
<p>Äänielämys muodostaa yksittäisen olion elämysavaruudessa, ja äänielämykset muuttuvat nopeasti ajassa ja seuraavat toinen toistaan<sup id="ref-54_10" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 15--16)">[54]</a></sup>. Havaitsemamme äänimaailma (auditory scene, auditory space) muodostuu useista samanaikaisista äänivirroista (auditory stream), jotka voimme erottaa toisistaan ja joita voimme kuunnella selektiivisesti<sup id="ref-54" class="ref"><a href="#note-54_11" title="(Jauhiainen 1995, 19)">[54]</a></sup>. Tässä yhteydessä voimme rinnastaa äänielämyksen äänivirtaan (ks. tarkemmin <a title="kohta 2.2" href="#ch-2_2">kohta 2.2</a>). Jauhiaisen<sup id="ref-54_12" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 18--19)">[54]</a></sup> mukaan äänen ajallisuus ja paikallisuus ovat tässä ja nyt koettuja, ja siten tärkeämpiä piirteitä elämyksessä kuin voimakkuus ja korkeus. Äänen paikantamisen avulla voimme mieltää itsemme suhteessa ympäröivään fyysiseen äänimaailmaan.<sup id="ref-54_13" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 18--19)">[54]</a></sup>.</p>
<p>Kun kaksi korkeudeltaan ja voimakkuudeltaan samantasoista ääntä kuulostaa erilaiselta, kyse on erosta äänen <em>värissä</em> (timbre). Äänen väri muodostuu äänen syttymisen (attack), sammumisen (decay) ja äänen harmonisen rakenteen perusteella.<sup id="ref-49_1" class="ref"><a href="#note-49" title="(Goldstein 1999, 318, 356)">[49]</a></sup>. Oleellista ei kuitenkaan ole äänen merkityksetön jakaminen korkeuteen, voimakkuuteen tai kestoon, vaan se, miten äänilähteet erotellaan toisistaan merkityksellisten tapahtumien havaitsemiseksi ja luokittelemiseksi hierarkioihin<sup id="ref-48_3" class="ref"><a href="#note-48" title="(Gibson 1966, 89)">[48]</a></sup>. Jauhiaisen<sup id="ref-54_14" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 15)">[54]</a></sup> mielestä lyhytkestoiset äänielämykset sisältävät rajoitetusti merkityssisältöä, kun taas pitempikestoiset äänielämykset muodostavat mielekkäitä kokonaisuuksia sisältäen paitsi tietoa äänilähteiden ominaisuuksista, myös äänen välittämiä käsitteellisiä, tunnepitoisia, esteettisiä, arvostuksellisia tai tahtomista ilmaisevia merkityksiä. Jauhiaisen näkemys on äärimmäisen yksinkertaistettu: se ei määrittele, mikä on lyhyt ja mikä pitkä ääni, eikä liioin ota huomioon kontekstin merkitystä. Lyhytkin ääni voi olla tietyssä kontekstissa erittäin merkitsevä.</p>
<p>Mansur ym.<sup id="ref-62_0" class="ref"><a href="#note-62" title="(Mansur ym. 1985, 117)">[62]</a></sup> jakavat äänen seuraaviin parametreihin: korkeus, voimakkuus, spatiaalinen sijainti, kesto, sointiväri, äänen syttyminen sekä ajoitus. Niin vähän kuin nämä erottelut kertovatkin äänten monimutkaisesta rakenteesta, ne auttavat hahmottamaan tutkimusaluetta ja jakamaan sen pienempiin kokonaisuuksiin. Tässä tutkimuksessa keskitytään ainoastaan äänielämyksen ajallisuuden ja paikallisuuden dynaamiseen suhteeseen sekä niiden sisältämään informaatiosisältöön (merkitykseen) käyttöliittymässä. Selvyyden vuoksi jatkossa puhutaan pelkästään äänestä (tai ääniobjektista/ -tapahtumasta, ks. <a title="kohta 2.4" href="#ch-2_4">kohta 2.4</a>).</p>
</div>
<div id="ch-2_2">
<h4>2.2 Äänten ryhmittely <a title="takaisin sisällysluetteloon" href="#toc-2_2">^</a></h4>
<p>Ryhmittelemme ääniä erillisiksi <em>äänivirroiksi</em> (auditory stream)<sup id="ref-60_2" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup>. Bregmanin ja Campbellin<sup id="ref-19_0" class="ref"><a href="#note-19" title="(Bregman ja Campbell 1971, 244)">[19]</a></sup> mukaan äänivirta muodostuu samanlaisista äänitapahtumista, jotka erotellaan muista samanaikaisista äänitapahtumista. Bregman ja Campbell<sup id="ref-19_1" class="ref"><a href="#note-19" title="(Bregman ja Campbell 1971, 244)">[19]</a></sup> olettavat, että kuuntelija voi suunnata huomionsa vain yhteen äänivirtaan kerrallaan. Äänivirta mentaalisena kokemuksena vastaa visuaalisen objektin kokemista ja on siten analoginen suhteessa hahmopsykologiaan (Gestalt)<sup id="ref-55_0" class="ref"><a href="#note-55" title="(Jones 1993, 98)">[55]</a></sup><sup id="ref-73" class="ref"><a href="#note-73" title="(Smith, Pickett &amp; Williams 1994, 174)">[73]</a></sup><sup id="ref-82_0" class="ref"><a href="#note-82" title="(Williams 1994, 97)">[82]</a></sup>. Äänivirran ja aistikanavan (ks. Broadbent<sup id="ref-26" class="ref"><a href="#note-26" title="(Broadbent 1958)">[26]</a></sup>) ero Bregmanin ja Campbellin<sup id="ref-19_2" class="ref"><a href="#note-19" title="(Bregmanin ja Campbell 1971, 249)">[19]</a></sup> mukaan on siinä, että äänivirta on kullakin hetkellä järjestelty kokonaisuus, eikä sitä voida määritellä yhtenä fyysisenä ominaisuutena. Äänivirran funktiona on järjestellä äänimateriaali ensin, jonka jälkeen aistikanava voi prosessoida tätä äänimateriaalia yksi äänivirta kerrallaan<sup id="ref-19_3" class="ref"><a href="#note-19" title="(Bregman &amp; Campbell 1971, 249)">[19]</a></sup>. Chion<sup id="ref-33_2" class="ref"><a href="#note-33" title="(Chion 1990, 13)">[33]</a></sup>, Ballas<sup id="ref-7" class="ref"><a href="#note-7" title="(Ballas 1994, 80)">[7]</a></sup> ja Williams<sup id="ref-82_1" class="ref"><a href="#note-82" title="(Williams 1994, 96)">[82]</a></sup> painottavat, että äänivirta on havaintoon perustuva tulkinta äänilähteestä, eikä siis vastaa äänilähteen aiheuttamaa fysikaalista tapahtumaa. Williamsin<sup id="ref-82_2" class="ref"><a href="#note-82" title="(Williams 1994, 96--97)">[82]</a></sup> mielestä ideaalitilanteessa ollaan silloin, kun havaitsemamme äänivirta sisältää vain äänilähteen tunnistamisessa tarvittavan keskeisen informaation. Tämä on tärkeä huomio: turha informaatio voidaan poistaa suunniteltaessa ääniä käyttöliittymään.</p>
<p>Williams<sup id="ref-82_3" class="ref"><a href="#note-82" title="(Williams 1994, 96)">[82]</a></sup> määrittelee äänten ryhmittelyn havainnolliseksi prosessiksi, jossa kuuntelija erottelee akustisesta signaalista saadun informaation yksittäisiksi merkityksellisiksi äänitapahtumiksi. Kuuntelija voi kuunnella yhtä äänilähdettä ja samalla kuulla, mutta olla kiinnittämättä huomiotaan muihin äänilähteisiin<sup id="ref-48_4" class="ref"><a href="#note-48" title="(Gibson 1966, 83)">[48]</a></sup>. Goldstein<sup id="ref-49_2" class="ref"><a href="#note-49" title="(Goldstein 1999, 359--362)">[49]</a></sup> esittää yleiset periaatteet äänten ryhmittelylle. Äänet ryhmitellään ensinnäkin niiden sijainnin perusteella. Äänet, jotka ovat peräisin yksittäisestä äänilähteestä, tulevat yleensä yhdestä sijainnista äänellisestä avaruudesta. Näin ollen voimme erottaa vasemmalla puolellamme käydyn hiljaisen keskustelun takanamme käydystä äänekkäästä keskustelusta osittain siksi, että ne sijoittuvat eri paikkoihin. Juuri paikantamisen avulla kykenemme havaitsemaan ja erottelemaan äänet toisistaan (<a title="Luku 3" href="#ch-3">luvussa 3</a> käsitellään tätä tarkemmin).</p>
<p>Äänen sijainti ei kuitenkaan ole keskeinen (eikä ainoa) tekijä erottelun kannalta: voimme kuunnella kamariorkesteria yhdestä kaiuttimesta ja silti selkeästi erotella yksittäiset soittimet<sup id="ref-41_0" class="ref"><a href="#note-41" title="(Fitch &amp; Kramer 1994, 308)">[41]</a></sup>. Kuulohavaintojärjestelmämme pystyy siis erottelemaan useita äänivirtoja &#8220;akustisesta suosta&#8221; yhtä aikaa ilman että meidän täytyisi turvautua spatiaalisiin vihjeisiin<sup id="ref-41_1" class="ref"><a href="#note-41" title="(Fitch &amp; Kramer 1994, 308)">[41]</a></sup>. Goldsteinin<sup id="ref-49_3" class="ref"><a href="#note-49" title="(Goldstein 1999, 359--362)">[49]</a></sup> mukaan äänet ryhmitellään sijainnin lisäksi niiden äänenvärin, sävelkorkeuden ja esiintymistiheyden perusteella. Äänet jotka alkavat ja loppuvat eri aikaan, ryhmitellään eri ryhmiin, kun taas äänet, jotka ovat staattisia ja jatkuvia, ryhmitellään samasta äänilähteestä tulevaksi.<sup id="ref-49_4" class="ref"><a href="#note-4" title="(Goldstein 1999, 359--362)">[49]</a></sup>.</p>
</div>
<div id="ch-2_3">
<h4>2.3 Aistihavaintojärjestelmät <a title="takaisin sisällysluetteloon" href="#toc-2_3">^</a></h4>
<p>Gibson<sup id="ref-48_5" class="ref"><a href="#note-48" title="(Gibson 1966, 47)">[48]</a></sup> korostaa aistien olevan aktiivisia mieluummin kuin passiivisia, järjestelmiä enemmän kuin kanavia ja enemmän toistensa kanssa vuorovaikutuksessa olevia kuin toisensa poissulkevia. Gibson kutsuukin aisteja <em>aktiivisiksi havaintojärjestelmiksi</em> (perceptual systems).<sup id="ref-48_6" class="ref"><a href="#note-48" title="(Gibson 1966, 47)">[48]</a></sup>. Tämä on tärkeä huomio: on tehtävä ero kuulemisen ja kuuntelemisen välillä (samoin kuin näkemisen ja katsomisen välillä). Ihmisen kuulohavaintojärjestelmä mahdollistaa kuulemisen (passiivista), kun taas kuunteleminen on ihmisen aktiivista toimintaa<sup id="ref-48_7" class="ref"><a href="#note-48" title="(Gibson 1966, 49--51)">[48]</a></sup>. Gibsonin<sup id="ref-48_8" class="ref"><a href="#note-48" title="(Gibson 1966, 83)">[48]</a></sup> mielestä kuulohavaintojärjestelmä on kuuntelemista varten; kuuleminen sen sijaan on sattumanvaraista.</p>
<p>Kuulohavaintojärjestelmän funktiona ei siis ole vain kuulemisen mahdollistaminen, vaan aktiivinen äänilähteen suunnan havaitseminen (ks. <a title="Luku 3" href="#ch-3">luku 3</a>), jolloin voimme suuntautua ääntä kohti (tai siitä poispäin!), sekä äänilähteen luonteen havaitseminen, jolloin kykenemme tunnistamaan sen<sup id="ref-48_9" class="ref"><a href="#note-48" title="(Gibson 1966, 75)">[48]</a></sup> (ks. <a title="Luku 4" href="#ch-4">luku 4</a>).</p>
</div>
<div id="ch-2_4">
<h4>2.4 Audiovisuaalinen sopimus <a title="takaisin sisällysluetteloon" href="#toc-2_4">^</a></h4>
<p>Chion<sup id="ref-33_3" class="ref"><a href="#note-33" title="(Chion 1990, 9)">[33]</a></sup> käyttää abstraktia käsitettä <em>audiovisuaalinen sopimus</em> (audiovisual contract) kuvaamaan äänellisen ja visuaalisen havainnon vuorovaikutteista suhdetta. Kuuntelija/katselija sulauttaa mielessään äänen ja kuvan yhdeksi kokonaisuudeksi<sup id="ref-33_4" class="ref"><a href="#note-33" title="(Chion 1990, 9)">[33]</a></sup>. Kysymykset &#8220;mitä kuulen siinä minkä näen?&#8221; ja &#8220;mitä näen siinä minkä kuulen?&#8221; ilmentävät audiovisuaalista sopimusta<sup id="ref-33_5" class="ref"><a href="#note-33" title="(Chion 1990, 192)">[33]</a></sup>. Seuraavassa tarkastellaan tätä kuulo- ja näköaistin suhdetta sekä kokonaisuutena että kummankin aistin kohdalla erikseen, jotta saadaan selville kunkin vahvimmat puolet. Tässä tutkimuksessa audiovisuaalinen sopimus viittaa äänen ja kuvan yhtäaikaiseen esittämiseen multimodaalissa käyttöliittymässä.</p>
<p>Kun edellisessä kohdassa määrittelimme kuuntelemisen aktiiviseksi toiminnaksi, on tarpeen pohtia sitä, miten se eroaa katselemisesta. Ensinnäkin, voimme kuunnella ja paikantaa sellaisia objekteja, joita emme näe<sup id="ref-60_3" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup>. Schaeffer<sup id="ref-70_0" class="ref"><a href="#note-70" title="(Schaeffer 1967, 91--99)">[70]</a></sup> kutsuu tätä akusmaattiseksi kuuntelemiseksi (acousmatic listening)<sup id="ref-33_6" class="ref"><a href="#note-33" title="(Chion 1990, 71)">[33]</a></sup>. Siinä missä näköaistin avulla keskitymme vain yhteen suuntaan ja saamme yksityiskohtaista tietoa silloisessa (rajoittuneessa) näköpiirissämme olevista objekteista, voimme kuuloaistin avulla tarkkailla ympäristöämme samanaikaisesti kaikista suunnista<sup id="ref-60_4" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup>. Tässä on ratkaiseva ero: enemmän kuin puolet senhetkisestä ympäristöstä jää näköpiirimme ulkopuolelle<sup id="ref-66_0" class="ref"><a href="#note-66" title="(Perrott, Saberi, Brown &amp; Strybel 1990, 214)">[66]</a></sup>. Perrottin ym.<sup id="ref-66_1" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 214)">[66]</a></sup> mukaan tässä kapeassa näköpiirissä informaation prosessointikapasiteetti on verraten rajattu, ollen tehokkainta vain katseen keskipisteen ympärillä. Kuuloaistimme avulla voimme siis määritellä, mitkä osat ympäristöstämme tuodaan näköaistin alueelle<sup id="ref-48_10" class="ref"><a href="#note-48" title="(Gibson 1966, 83)">[48]</a></sup><sup id="ref-66_2" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 214--215)">[66]</a></sup><sup id="ref-79_0" class="ref"><a href="#note-79" title="(Wenzel 1992, 81)">[79]</a></sup>.</p>
<p>Perrott ym.<sup id="ref-66_3" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 219)">[66]</a></sup> osoittivat tutkimuksessaan, että akustinen spatiaalinen informaatio auttaa löytämään näytöltä objektin nopeammin, kun kohde on näkökentän ulkopuolella. Vielä merkittävämpää tutkimuksessa on kuitenkin se, että myös näkökentän keskellä oleva kohde löytyi spatiaalisen äänen avulla nopeammin kuin pelkästään näön avulla<sup id="ref-66_4" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 224)">[66]</a></sup>. Heidän hypoteesinsa, että kuulohavaintojärjestelmän ensisijainen funktio on osoittaa silmille minne katsoa<sup id="ref-66_5" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 214)">[66]</a></sup>, saa siten vahvistusta. Äänen avulla voidaan siis saada tietoa taka-alan prosesseista. Perrott ym.<sup id="ref-66_6" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 215)">[66]</a></sup> toteavat, että ihmiset painottavat kuitenkin enemmän visuaalista informaatiota kuin minkään muun aistin tuottamaa informaatiota. Tämä saattaa olla tunnusomaista länsimaiselle kulttuurille (jonka piirissä tietokoneiden kehitys jostain syystä tapahtuukin). Luultavasti tästä syystä käyttöliittymissä on käytetty yksinomaan visuaalista modaliteettia.</p>
<p>Toinen oleellinen ero suuntautumisen lisäksi on ajallisuus ja spatiaalisuus. Chionin<sup id="ref-33_7" class="ref"><a href="#note-33" title="(Chion 1990, 11, 136)">[33]</a></sup> sekä Fitchin ja Kramerin<sup id="ref-41_2" class="ref"><a href="#note-41" title="(Fitch ja Kramer 1994, 308)">[41]</a></sup> mukaan näköaistin vahvuutena on objektien spatiaalinen havaitseminen, jolloin kuuloaistille jää niiden ajallinen ulottuvuus. Perrott ym.<sup id="ref-66_7" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 219)">[66]</a></sup> sekä Fitch ja Kramer<sup id="ref-41_3" class="ref"><a href="#note-41" title="(Fitch ja Kramer 1994, 322--323)">[41]</a></sup> olettavat, että näköaisti on kehityksen kuluessa tottunut prosessoimaan spatiaalisia objekteja peräkkäisesti (jolloin katselijan täytyy silmien liikkeellä käydä kaikki objektit läpi), kun taas kuuloaisti on erikoistunut useiden väliaikaisten objektien havaitsemiseen samanaikaisesti. Näkemys on vahvasti yksinkertaistettu: spatiaaliset ja ajalliset ulottuvuudet menevät aistien kesken myös limittäin, kuten saamme myöhemmin huomata (ks. myös Gibson<sup id="ref-48_11" class="ref"><a href="#note-48" title="(Gibson 1966)">[48]</a></sup>). Tällainen keinotekoinen erottelu on kuitenkin hyödyllinen, koska sen avulla päästään tarkastelemaan kuulon ja näön keskeisiä eroavaisuuksia. Erottelulla on myös fysikaaliset perusteet: Gibsonin<sup id="ref-48_12" class="ref"><a href="#note-48" title="(Gibson 1966, 49--51)">[48]</a></sup> ja Gaverin<sup id="ref-43_0" class="ref"><a href="#note-43" title="(Gaver 1989, 71)">[43]</a></sup> mukaan näkö perustuu valon heijastukseen erilaisista pinnoista, kun taas ääni on seurausta materiaalien värähtelystä (aiheuttaen ilman värähtelyä).</p>
<p>Emme voi kuulla ilmanpaineen absoluuttista arvoa, vain sen muutoksen ajassa<sup id="ref-69_0" class="ref"><a href="#note-69" title="(Scaletti &amp; Craig 1991, 210)">[69]</a></sup>. Äänen ajallisen ominaisuuden vuoksi se voidaan hyvin liittää animoituun grafiikkaan; staattinen visuaalinen ikoni ei välttämättä kuvaa ääntä parhaalla mahdollisella tavalla<sup id="ref-69_1" class="ref"><a href="#note-69" title="(Scaletti &amp; Craig 1991, 210)">[69]</a></sup><sup id="ref-16_1" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 455)">[16]</a></sup>. Gaver<sup id="ref-43_1" class="ref"><a href="#note-43" title="(Gaver (1989, 70--71)">[43]</a></sup> on päässyt asian ytimeen seuraavalla toteamuksellaan: &#8220;sound exists in time and over space, vision exists in space and over time&#8221;. Hänen mukaansa äänet ovat olemassa ajassa, jolloin niiden alku ja loppu huomataan usein; sitä vastoin visuaaliset objektit ovat pysyviä ja niiden ilmestyminen tai häipyminen huomataan vain satunnaisesti. Ääntä ei välttämättä kuulla kuin kerran, mutta visuaalista objektia voi aina katsoa uudestaan. Tästä syystä ääni sopii erityisen hyvin kuvaamaan väliaikaisia tapahtumia (kausaaliset tapahtumat, esimerkiksi oven sulkeminen; ks. Fitch &amp; Kramer<sup id="ref-41_4" class="ref"><a href="#note-41" title="(Fitch &amp; Kramer 1994, 324)">[41]</a></sup>), kun taas  staattisia objekteja voidaan paremmin kuvata visuaalisesti. Toisaalta visuaaliset objektit saattavat tukkia näytön kokonaan. Gaver pohtii, että visuaalisia objekteja voidaan sijoittaa samanaikaisesti useisiin paikkoihin ja että spatiaalisten samanaikaisten äänten määrä on rajoitetumpi kuin visuaalisten objektien.<sup id="ref-43_2" class="ref"><a href="#note-43" title="(Gaver (1989, 71)">[43]</a></sup>.</p>
<p>Niin tärkeitä kuin Gaverin huomiot ovatkin, hänen näkökulmansa tässä suhteessa on selvästi rajoittunut ja aikansa tuote: tässä tutkimuksessa tullaan osoittamaan, että spatiaalisen äänen avulla voidaan onnistuneesti esittää useita objekteja samanaikaisesti, jolloin myös visuaalisten objektien suma näytöllä hälvenee. Ääni todellakin on kiinni ajassa; tästä on osoituksena se, ettei ääniä ole säilynyt menneiltä ajoilta, toisin kuin visuaalisia esineitä. Vasta äänen tallennustekniikoiden ansiosta ääntä on voitu vangita ja toistaa aina uudelleen.</p>
<p>Edellä on ollut puhetta visuaalisesta ja äänellisestä <em>objektista</em> ja <em>äänitapahtumasta</em>. Mikä sitten on näiden ero, ja miten objekti määritellään? Visuaaliset objektit voidaan nähdä ja niiden rajat ovat selvät. Fitchin ja Kramerin<sup id="ref-41_5" class="ref"><a href="#note-41" title="(Fitch ja Kramer 1994, 308)">[41]</a></sup> mukaan objektin spatiaalinen sijainti ja osien yhtenäisyys määrittävät visuaalisen objektin, jolloin näyttö voidaan helposti jakaa erillisiksi komponenteiksi. Ääniobjektin kohdalla tilanne on pulmallisempi: miten määritellä ääniobjektin rajat? Tähän on useita tapoja: (a) sijoittamalla äänet spatiaalisesti, (b) määrittelemällä objekti vuorovaikutuksessa toisen objektin kanssa, tai (c) Kramerin<sup id="ref-60_5" class="ref"><a href="#note-60" title="(Kramer 1994, 12)">[60]</a></sup> tapaan joko liikuttamalla ääntä sijainnista toiseen tai liikuttamalla subjektia äänen läpi. Kramer (ks. myös Blattner ym.<sup id="ref-16_2" class="ref"><a href="#note-16" title="Blattner ym. 1994, 454)">[16]</a></sup>) siis ajattelee ääniobjektin rajaavan &#8220;palan&#8221; äänellisestä tilasta juuri liikkeensä avulla. Tässä tutkimuksessa ääniobjektien erottamiseksi on valittu spatiaalinen ja paikallaan pysyvä ääni.</p>
<p>Eräs pohdittava asia on myös se, onko ääniobjekti yksi ääni vai sarja nopeita, peräkkäisiä ääniä. Jones<sup id="ref-55_1" class="ref"><a href="#note-55" title="(Jones 1993, 98)">[55]</a></sup> kutsuu äänellistä tapahtumaa objektiksi, perustellen sen olevan analoginen suhteessa visuaaliseen objektiin. Schafer<sup id="ref-71_3" class="ref"><a href="#note-71" title="(Schafer 1977, 129--130)">[71]</a></sup> puolestaan nimittää laboratorioissa toistettavia ääniä (siis kontekstistaan irrotettuja ääniä) ääniobjekteiksi, kun taas äänitapahtumiksi sellaisia ääniä, jotka tapahtuvat tietyssä paikassa tiettynä aikana ja aiheuttavat siten merkityksen. Tällöin ne viittaavat kontekstiin, jossa ne tapahtuvat, sisältäen alun, keskikohdan ja lopun. Teollisen ajan keinotekoiset äänet sisältävät lähes yksinomaan äänen keskikohdan ilman selkeää alkua tai loppua, toisin kuin luonnolliset äänet<sup id="ref-71_4" class="ref"><a href="#note-71" title="(Schafer 1977, 130)">[71]</a></sup>.</p>
<p>Tässä tutkimuksessa käytetään tästä eteenpäin käsitteitä äänitapahtuma ja ääniobjekti rinnakkain, jälkimmäisen viitatessa sen visuaaliseen vastineeseen. Oleellista on se, mitä ääni tarkoittaa eri konteksteissa ja se, että peräkkäisten äänten järjestys on looginen. Tähän asiaan palataan kohdassa 2.6. Äänimaisema muodostuu vuorovaikutteisista äänitapahtumista, jotka puolestaan syntyvät erilaisten vuorovaikutusten tuloksena<sup id="ref-16_3" class="ref"><a href="#note-16" title="Blattner ym. 1994, 454)">[16]</a></sup>. Blattnerin ym.<sup id="ref-16_4" class="ref"><a href="#note-16" title="Blattner ym. 1994, 454)">[16]</a></sup> mielestä assosioimalla spatiaalinen ääni vastaavaan visuaaliseen objektiin myös ääni muistetaan paremmin.</p>
<p>Ääni siis perustuu vaihteluihin ajassa ja viittaa yleensä muutokseen ja tilan tarkkailuun<sup id="ref-18_0" class="ref"><a href="#note-18" title="(Bly 1982, 374)">[18]</a></sup><sup id="ref-79_1" class="ref"><a href="#note-79" title="(Wenzel 1992, 81)">[79]</a></sup><sup id="ref-60_6" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup><sup id="ref-76_0" class="ref"><a href="#note-76" title="(Walker &amp; Brewster 2000, 2)">[76]</a></sup>, kuvan ollessa joko staattinen tai liikkuva (animoitu). Esimerkkinä tilan muutoksesta on viinipullosta lähtevä ääni sen tyhjentyessä. Chionin<sup id="ref-33_8" class="ref"><a href="#note-33" title="(Chion 1990, 9--10)">[33]</a></sup> mielestä kuitenkin myös ääni voi joissain tilanteissa ilmaista staattisuutta; tällöin äänessä ei ole mitään variaatioita. Tällaisia ääniä ovat esimerkiksi puhelimen valintaääni, kaiuttimen hurina tai jokin äänisilmukka. On vaikea olla kuulematta äänessä edes vähäisiä vihjeitä epäsäännöllisyydestä tai liikkeestä.<sup id="ref-33_9" class="ref"><a href="#note-33" title="(Chion 1990, 9--10)">[33]</a></sup>. Käyttöliittymäkontekstissa on kuitenkin tärkeää, ettei ääni ole staattinen, vaan että sillä on aina jokin selkeä funktio.</p>
<p>Edellä esitetyn perusteella päädytään esittämään Scalettin ja Craigin<sup id="ref-69_2" class="ref"><a href="#note-69" title="(Scalett ja Craig 1991, 210)">[69]</a></sup> käyttämä malli, johon myös tämä tutkimus pohjimmiltaan perustuu. Mallin ideana on, että reaalimaailman objektit voidaan esittää monella tavalla, tässä tapauksessa joko äänen tai kuvan avulla. Objekteilla voidaan olettaa olevan sekä visuaalisia että äänellisiä ulottuvuuksia<sup id="ref-16_5" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 465)">[16]</a></sup>. Olettamuksena siis on, että katseleminen täydentää kuuntelemista ja toisinpäin: tästä seuraa, että saman objektin tarjoama äänellinen tai kuvallinen informaatio voi tilanteesta riippuen olla myös toisteista. KUVIOSSA 1 on havainnollistettu tätä mallia. Seuraavassa kohdassa tarkastellaan kahta erilaista kuuntelemisen tapaa.</p>
</div>
<div id="ch-2_5">
<h4>2.5 Jokapäiväinen ja musiikillinen kuuntelu <a title="takaisin sisällysluetteloon" href="#toc-2_5">^</a></h4>
<p>Gaver<sup id="ref-43_3" class="ref"><a href="#note-43" title="(Gaver 1989, 72--73)">[43]</a></sup> <sup id="ref-44_1" class="ref"><a href="#note-44" title="(Gaver 1993a, 286)">[44]</a></sup><sup id="ref-46_1" class="ref"><a href="#note-46" title="(Gaver 1993c, 1--2)">[46]</a></sup> tekee eron <em>musiikillisen</em> ja <em>jokapäiväisen</em> kuuntelemisen välillä: edellinen viittaa ääniaallon fyysisten attribuuttien havaitsemiseen (esimerkiksi äänen korkeus), ja jälkimmäinen äänilähteiden havaitsemiseen ympäristössämme. Gaverin mielestä emme oven sulkeutuessa kuule siitä aiheutuvan äänen korkeutta, vaan sen sijaan saatamme havaita oven koon, materiaalin ja sulkemiseen käytetyn voiman.<sup id="ref-43_4" class="ref"><a href="#note-43" title="(Gaver 1989, 72--73)">[43]</a></sup>. Keskeistä Gaverin ajattelussa on se, että jokapäiväisessä elämässämme emme kuule ääniä itsessään, sellaisenaan, vaan äänilähteen ominaisuuksia tietyssä kontekstissa. Näkökulma perustuu Gibsonin<sup id="ref-48_13" class="ref"><a href="#note-48" title="(Gibson 1966)">[48]</a></sup> ajatuksiin. Chion<sup id="ref-33_10" class="ref"><a href="#note-33" title="(Chion 1990, 25)">[33]</a></sup> kutsuu tätä kausaaliseksi kuuntelemiseksi. Chionin<sup id="ref-33_11" class="ref"><a href="#note-33" title="(Chion 1990, 26--27)">[33]</a></sup> mielestä kontekstistaan irrotetun yksittäisen äänen tunnistaminen on vaikeaa: saatamme tunnistaa vain äänilähteen yleiset piirteet, esimerkiksi &#8220;jonkin koneellisen äänen&#8221;. Chionin mielestä voimme kuulla äänen kausaalisesti, eli siis kuulla ja tunnistaa raapimisen tai aistia sen nopeuden, mutta sen sijaan emme kuule mikä raapii mitä<sup id="ref-33_12" class="ref"><a href="#note-33" title="(Chion 1990, 26--27)">[33]</a></sup>.</p>
<p><img id="figure-1" src="http://www.akikoo.org/wp-content/themes/aksu/images/object.png" alt="Objektin äänellinen ja visuaalinen esitys" /></p>
<h5>KUVIO 1. Objektin äänellinen ja visuaalinen esitys <a title="takaisin sisällysluetteloon" href="#toc-figure_1">^</a></h5>
<p>Chion<sup id="ref-33_13" class="ref"><a href="#note-33" title="(Chion 1990, 27)">[33]</a></sup> painottaa, että ääni on seurausta vähintään kahdesta äänilähteestä. Chion siis erottaa äänilähteen vuorovaikutuksen muodosta ja eroaa siten hieman Gaverin teoriasta. Chion<sup id="ref-33_14" class="ref"><a href="#note-33" title="(Chion 1990, 28)">[33]</a></sup> käyttää vielä nimitystä semanttinen kuunteleminen, joka tarkoittaa viestin tulkitsemista tietyn koodin tai kielen avulla. Käytännössä semanttinen ja jokapäiväinen kuunteleminen tarkoittaa samaa asiaa: kyse on äänten tulkitsemisesta. Gaver<sup id="ref-46_2" class="ref"><a href="#note-46" title="(Gaver (1993c, 18)">[46]</a></sup> painottaa, ettei jokapäiväistä kuuntelua voi tutkia pelkästään äänilähteiden fyysisten ominaisuuksien perusteella; tärkeintä on se, mitä kuuntelijat havaitsevat.</p>
<p>Psykologit ovat perinteisesti olleet kiinnostuneita juuri musiikilliseen kuunteluun vaikuttavista havainnollisista ilmiöistä, vaikka suurin osa jokapäiväisestä kuuntelusta ei sitä ole<sup id="ref-46_3" class="ref"><a href="#note-46" title="(Gaver 1993c, 1--2)">[46]</a></sup>. Gaver nimittää näitä perinteisen psykoakustisen tutkimuksen parametreja äänen primitiivisiksi (fysikaalisiksi) ulottuvuuksiksi<sup id="ref-46_4" class="ref"><a href="#note-46" title="(Gaver 1993c, 1--2)">[46]</a></sup>. Schaeffer<sup id="ref-70_1" class="ref"><a href="#note-70" title="(Schaeffer (1967, 270)">[70]</a></sup> kutsuu tätä pelkistetyksi kuuntelemiseksi (reduced listening), koska siinä keskitytään ääneen itsessään, irrotettuna sen syystä ja merkityksestä<sup id="ref-33_15" class="ref"><a href="#note-33" title="(Chion 1990, 29)">[33]</a></sup>. Myös Chionin<sup id="ref-33_16" class="ref"><a href="#note-33" title="(Chion 1990, 31)">[33]</a></sup> mielestä äänellä on kausaalisuutensa lisäksi myös oma esteettinen arvonsa johtuen äänen väristä ja tekstuurista. Gaver<sup id="ref-46_5" class="ref"><a href="#note-46" title="(Gaver 1993c, 1--2)">[46]</a></sup> painottaa kuitenkin, että ero on kokemuksessa, ei äänissä. On siis hyvinkin mahdollista kuunnella myös jokapäiväistä äänimaisemaamme musiikkina. Gaver mainitsee tässä säveltäjä John Cagen, joka on hyödyntänyt tätä seikkaa sävellyksissään.<sup id="ref-46_6" class="ref"><a href="#note-46" title="(Gaver 1993c, 1--2)">[46]</a></sup>.</p>
<p>Gaverin mielestä jokapäiväisen kuuntelun tuottama informaatio voi toimia perustana uuden viitekehyksen luomisessa: voimme manipuloida ääntä sen äänilähteen ulottuvuuksien kautta, ei itse äänen ulottuvuuksien kautta<sup id="ref-46_7" class="ref"><a href="#note-46" title="(Gaver 1993c, 2)">[46]</a></sup>. Gaver vertailee ääniä seuraavalla tavalla: musiikilliset äänet eivät edusta päivittäin kuulemaamme äänimaisemaa, koska useimmat musiikilliset äänet ovat harmonisia, kun taas jokapäiväiset äänet eivät ole, sisältäen myös hälinää; musiikilliset äänet paljastavat vähemmän lähteistään kuin jokapäiväiset äänet; musiikillisilla instrumenteilla muutokset äänen korkeudessa tai voimakkuudessa (siis fyysisissä attribuuteissa) eivät ole niin informatiivisia kuin jokapäisten äänten tuottamat variaatiot.<sup id="ref-46_8" class="ref"><a href="#note-46" title="(Gaver 1993c, 3)">[46]</a></sup>. Tämä on mielenkiintoinen näkökulma, koska tällöin päästään tarkastelemaan aktiivisesti äänimaisemaa ajassa, eikä pelkästään passiivisesti &#8220;kivettynyttä&#8221; musiikillista ärsykettä. Gaverin erittely paljastaa, että perinteiset musiikilliset äänet edustavat vain muutamaa prosentin murto-osaa siitä mahdollisesta kapasiteetista, jonka jokapäiväinen ääniympäristömme joka hetki tuottaa.</p>
</div>
<div id="ch-2_6">
<h4>2.6 Syntaktiset ja semanttiset tekijät äänten tunnistamisessa <a title="takaisin sisällysluetteloon" href="#toc-2_6">^</a></h4>
<p>Käyttöliittymässä on tärkeää, että äänen merkitys on yksiselitteinen; tätä varten äänen on oltava tunnistettava. Kieli voidaan jakaa kolmeen tasoon: sanoihin (lexical level), kielioppiin/syntaksiin (syntactic level) ja semantiikkaan<sup id="ref-16_6" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 450)">[16]</a></sup>. Jos näitä tasoja sovelletaan ei-puheääniin, äänen fysikaaliset attribuutit (esimerkiksi spatiaalisuus) edustavat alinta tasoa &#8212; jolle suurin osa äänitutkimuksesta on keskittynyt<sup id="ref-16_7" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 450)">[16]</a></sup>. Ääniä voidaan prosessoida ylhäältä alas (top-down) tai alhaalta ylös (bottom-up). Howardin ja Ballaksen<sup id="ref-52_0" class="ref"><a href="#note-52" title="(Howard ja Ballas 1980, 431)">[52]</a></sup> mukaan ylhäältä alas prosessoiminen perustuu tietoon (knowledge-driven), kun taas alhaalta ylös dataan (data-driven). Esimerkiksi puheen havaitsemisessa kuuntelijat käyttävät sekä kielen syntaktista ja semanttista rakennetta että äänilähteestä tulevaa havainnollista informaatiota. Vähemmän on kuitenkin tutkittu syntaktisten ja semanttisten tekijöiden vaikutusta monimutkaisiin ei-puheääniin.<sup id="ref-52_1" class="ref"><a href="#note-52" title="(Howard ja Ballas 1980, 431)">[52]</a></sup>.</p>
<p>Alhaalta ylös prosessoitaessa havaitaan äänen akustisia ominaisuuksia, joista rakennetaan merkityksiä muistin avulla, kun taas ylhäältä alas prosessoitaessa tulkitaan äänen merkitys sen kontekstin ja aiempien kokemusten perusteella, josta edetään äänen yksittäisten parametrien analysointiin<sup id="ref-8_0" class="ref"><a href="#note-8" title="(Ballas &amp; Howard 1987, 96)">[8]</a></sup><sup id="ref-60_7" class="ref"><a href="#note-60" title="(Kramer 1994, 5)">[60]</a></sup><sup id="ref-49_5" class="ref"><a href="#note-49" title="(Goldstein 1999, 376)">[49]</a></sup><sup id="ref-4_0" class="ref"><a href="#note-4" title="(Anderson 2000, 63)">[4]</a></sup>.</p>
<p>Monilla jokapäiväisillä monimutkaisilla ei-puheäänillä on määriteltävissä oleva jaksollinen rakenne (siis syntaksi kielen tavoin), samoin kuin semanttinen sisältö, ja ne havaitaan samanlaisten prosessien kautta kuin puhe<sup id="ref-52_2" class="ref"><a href="#note-52" title="(Howard &amp; Ballas 1980, 431)">[52]</a></sup><sup id="ref-62_1" class="ref"><a href="#note-62" title="(Mansur ym. 1985, 117)">[62]</a></sup><sup id="ref-8_1" class="ref"><a href="#note-8" title="(Ballas &amp; Howard 1987, 96)">[8]</a></sup><sup id="ref-16_8" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 448)">[16]</a></sup>. Erojakin toki on: kieli viittaa sosiaalisiin merkityksiin, kun taas ympäristön ei-puheäänet viittaavat kausaalisiin tapahtumiin (sidottu akustiikan fysikaalisiin lakeihin)<sup id="ref-48_14" class="ref"><a href="#note-48" title="(Gibson 1966, 91)">[48]</a></sup><sup id="ref-8_2" class="ref"><a href="#note-8" title="(Ballas &amp; Howard 1987, 98)">[8]</a></sup>. Esimerkiksi oven avaaminen ja henkilön astuminen huoneeseen muodostavat jakson ajallisesti järjestettyjä äänitapahtumia. Tällaisilla jaksoilla on tilapäinen rakenne, koska ne koostuvat yksittäisistä äänitapahtumista, jotka syntyvät äänilähteiden sanelemassa järjestyksessä ja joilla on äänilähteistä riippuva kesto.<sup id="ref-52_3" class="ref"><a href="#note-52" title="(Howard &amp; Ballas 1980, 431)">[52]</a></sup>.</p>
<p>Myös Deutschin<sup id="ref-37_0" class="ref"><a href="#note-37" title="(Deutsch 1980, 381)">[37]</a></sup> tutkimus tukee tätä näkemystä rakenteen merkityksestä: voimme prosessoida monimutkaistakin informaatiota sarjallisesti, jos informaatio on systemaattisesti organisoitu ja havaitsija ymmärtää sen rakenteen. Ryhmittelemme sarjallisia kuvioita jaksoihin, joita sitten järjestelemme hierarkioihin. Esimerkiksi kielessä merkityksellisen lauseen muodostavat sanat havaitaan ja muistetaan paremmin kuin vain sanat sattumanvaraisessa järjestyksessä.<sup id="ref-37_1" class="ref"><a href="#note-37" title="(Deutsch 1980, 381)">[37]</a></sup>. Tämä seikka on keskeinen sijoitettaessa ääniä käyttöliittymän toimintoihin.</p>
<p>Ei-puheäänten kohdalla syntaksi syntyy niistä mahdollisista väliaikaisista suhteista, joista sarja äänitapahtumia voi keskenään muodostaa järkevän kokonaisuuden (esimerkiksi a&#8211;a&#8211;c&#8211;d&#8211;d)<sup id="ref-52_4" class="ref"><a href="#note-52" title="Howard &amp; Ballas 1980, 436">[52]</a></sup>. Howardin ja Ballaksen<sup id="ref-52_5" class="ref"><a href="#note-52" title="Howard &amp; Ballas 1980, 436, 438">[52]</a></sup> mukaan tämän kokonaisuuden on oltava sekä syntaktisesti että semanttisesti järkevä: syntaksin täytyy pohjautua äänitapahtumien väliaikaiseen rakenteeseen, ja yksittäisten äänitapahtumien täytyy noudattaa syntaksia. Muutoin kuuntelijoilla on vaikeuksia havaita rakennetta.<sup id="ref-52_6" class="ref"><a href="#note-52" title="Howard &amp; Ballas 1980, 436, 438">[52]</a></sup>. Tätä seikkaa voidaan hyödyntää jakamalla käyttöliittymän toiminnot äänitapahtumien jaksoiksi: jakso koostuu toiminnoista, jotka käyttäjä tekee suorittaakseen jonkin tehtävän.</p>
<p>Warrenin ja Verbruggen<sup id="ref-78_0" class="ref"><a href="#note-78" title="(Warren ja Verbrugge 1984)">[78]</a></sup> tavoitteena oli löytää ne tekijät, joiden perusteella kuuntelija tunnistaa eri vuorovaikutuksen muodon. He tutkivat kahta eri tapausta, pullon särkymistä ja pomppimista kovalla alustalla, ja huomasivat, että spektraaliset erot eivät olleet ratkaisevia tunnistamisessa. Kuuntelijat kykenevät erottamaan pullon pomppimisen ja särkymisen toisistaan vain niiden ajallisten jaksojen perusteella.<sup id="ref-78_1" class="ref"><a href="#note-78" title="(Warren ja Verbrugge 1984, 711)">[78]</a></sup>. Tämä tutkimus on keskeinen, koska se vahvistaa edellä käsiteltyä näkemystä äänitapahtumien väliaikaisen rakenteen merkityksestä. Pomppiva pullo aiheuttaa erilaisen väliaikaisen jakson äänitapahtumia (tässä tapauksessa iskuja) kuin särkyvä pullo. Kuuntelijat reagoivat rytmiin halukkaammin kuin mihinkään muuhun äänen parametriin<sup class="ref"><a href="#4" title="(Blattner, Sumikawa &amp; Greenberg 1989, 23)">[4]</a></sup>. Luultavasti tästä syystä väliaikaisen rakenteen merkitys on niin ratkaiseva tunnistamisessa.</p>
<p>Voimme käyttää myös kontekstia apuna objektien tunnistamisessa ja merkityksenannossa<sup id="ref-8_3" class="ref"><a href="#note-8" title="(Ballas &amp; Howard 1987, 98)">[8]</a></sup><sup id="ref-9" class="ref"><a href="#note-9" title="(Ballas &amp; Mullins 1991)">[9]</a></sup><sup id="ref-4_1" class="ref"><a href="#note-4" title="(Anderson 2000, 63)">[4]</a></sup>. Usein hyvinkin erilaiset fysikaaliset tapahtumat aiheuttavat samankaltaisia ääniä<sup id="ref-16_9" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 450)">[16]</a></sup>. Schafer<sup id="ref-71_5" class="ref"><a href="#note-71" title="(Schafer 1977, 150)">[71]</a></sup> ottaa esimerkin: käärmeen sihinä ja kattilan kiehuminen ovat äänenä lähellä toisiaan, mutta herättävät eri kontekstissa erilaisen kokemuksen. Kun nämä kaksi ääntä irroitetaan kontekstistaan ja toistetaan nauhalta, niiden identiteetti hämärtyy. Korva ei ole tarpeeksi tarkka erottamaan näiden kahden äänen fysikaalisia eroja erottaakseen käärmeen sihinän ja veden kiehumisen toisistaan nauhalta.<sup id="ref-71_6" class="ref"><a href="#note-71" title="(Schafer 1977, 150)">[71]</a></sup>. Toisena esimerkkinä voisi olla ääni &#8220;klik-klik&#8221;: tällainen ääni voi kuulua kuulakärkikynästä, valokatkaisijasta, nitojasta tai kamerasta. Ainoastaan konteksti voi poistaa epäilyksen siitä, mistä on kyse. Ballas<sup id="ref-6_0" class="ref"><a href="#note-6" title="(Ballas 1993)">[6]</a></sup> arvioi akustisia, ekologisia, havainnollisia ja kognitiivisia tekijöitä, jotka ovat keskeisiä jokapäiväisten äänten tunnistamisessa. Tutkimuksessa oli mukana 41 lyhyttä ja toisistaan eroavaa jokapäiväistä ääntä. Tutkimus osoitti, että äänilähteen tunnistamiseen vaikuttavat ainakin akustiset (fysikaaliset) muuttujat, ekologinen frekvenssi, kausaalinen epävarmuus ja äänen tyypillisyys<sup id="ref-6_1" class="ref"><a href="#note-6" title="(Ballas 1993, 262)">[6]</a></sup>. Tutut äänet siis tunnistetaan nopeammin<sup id="ref-8_4" class="ref"><a href="#note-8" title="(Ballas &amp; Howard 1987, 103)">[8]</a></sup><sup id="ref-6_2" class="ref"><a href="#note-6" title="(Ballas 1993, 256)">[6]</a></sup>.</p>
<p>Edellä on alustavasti käsitelty äänten havaitsemiseen ja äänilähteiden tunnistamiseen liittyviä asioita. Luvun lopuksi on tarpeen koota keskeiset huomiot. Kuulohavaintojärjestelmän ansiosta voimme aktiivisesti suuntautua äänivirtaa kohti, kohdistaa katseemme tähän objektiin sekä tunnistaa sen joko kuulo- tai näköaistimme avulla. Jokapäiväiset äänet voivat välittää hienovaraisempaa informaatiota äänilähteestä kuin (perinteisten) musiikillisten instrumenttien tuottamat äänet. Kuuloaistilla tunnistettaessa on varmistettava, että äänitapahtumien sarja noudattaa syntaksia: tällöin äänitapahtumien muodostama kokonaisuus on semanttisesti looginen ja ymmärrettävä.</p>
<p>Anderson<sup id="ref-4_2" class="ref-4_2"><a href="#note-4" title="(Anderson 2000, 81)">[4]</a></sup> summaa luvun vielä seuraavasti: valitsemme äänen, johon suuntaudumme, äänen fysikaalisten ominaisuuksien perusteella (esimerkiksi korkeuden perusteella), jolloin &#8220;voimistamme&#8221; kyseistä ääntä ja vaimennamme muut äänet. Nämä muut äänet eivät kuitenkaan kokonaan vaimennu, vaan kiinnittävät huomiomme jos ne ovat fyysisiltä ominaisuuksiltaan korostavia (esimerkiksi kova ääni), semanttiselta sisällöltään kiintoisia (jos nimemme mainitaan) tai yhteneväisiä sillä hetkellä prosessoimamme äänen kanssa.<sup id="ref-4_3" class="ref"><a href="#note-4" title="(Anderson 2000, 81)">[4]</a></sup>. <a title="Luku 3" href="#ch-3">Seuraavassa luvussa</a> keskitytään tarkemmin yhteen äänen parametreista. Spatiaaliset jokapäiväiset äänet toimivat analogiana kielen sanoihin ja voivat muodostaa syntaksin &#8212; ja siten merkityksen &#8212; käyttöliittymäkontekstissa.</p>
</div>
<div id="ch-3">
<h3>3. Spatiaalinen ääni <a title="takaisin sisällysluetteloon" href="#toc-3">^</a></h3>
<p><span class="drop">Ä</span><span class="lead-in">äni välittää informaatiota</span> äänilähteen ja ympäristön lisäksi myös sijainnista<sup id="ref-46_9" class="ref"><a href="#note-46" title="(Gaver 1993c, 7)">[46]</a></sup>. Visuaalisen näkyvyyden heiketessä &#8212; esimerkiksi huonon valaistuksen vuoksi &#8212; täytyy turvautua spatiaaliseen äänimaisemaan<sup id="ref-49_6" class="ref"><a href="#note-49" title="(Goldstein 1999, 242)">[49]</a></sup>. Samassa tilanteessa ollaan myös silloin, kun näyttö on liian täynnä visuaalista informaatiota. Kuten <a title="Luku 2" href="#ch-2">edellisessä luvussa</a> todettiin, kuuntelija voi erottaa äänivirtoja myös yhdestä kaiuttimesta. Ääniä ryhmitellään siis myös muiden muuttujien kuin sijainnin perusteella. Onko spatiaalisen äänen funktio siten vain immersiivisyyden lisääminen tai navigointi tilassa? Tässä luvussa tarkastellaan spatiaalista ääntä ja pyritään löytämään tapoja sen hyödyntämiseen käyttöliittymässä. Jokapäiväisen spatiaalisen äänimaisemamme hyödyntäminen käyttöliittymässä voi parhaimmillaan johtaa intuitiiviseen vuorovaikutukseen.</p>
<p>Spatiaalisuus pitää sisällään useita tekstuureita: <em>polyfonia</em> muodostuu kahdesta tai useammasta samanaikaisesta, yhtä tärkeästä melodiasta; <em>homofonia</em> taas yhdestä päämelodiasta ja useista muista, säestävistä melodioista<sup id="ref-15" class="ref"><a href="#note-15" title="(Blattner, Greenberg &amp; Kamegai 1992, 101)">[15]</a></sup>. Käyttöliittymän kokonaisäänimaisema voisi siten muodostua polyfonisista äänivirroista sijoiteltuna spatiaalisesti. Äänimaisema voisi osin olla myös homofoninen, riippuen äänten tärkeydestä ja luokittelusta käyttöliittymän eri konteksteissa. Ennen spatiaalisen äänen tarkempaa määrittelyä on tarpeen käsitellä niitä tekijöitä, joiden perusteella ääni paikannetaan tietystä suunnasta tulevaksi. Luvussa pohditaan myös spatialisoinnin toteutukseen liittyviä ongelmia ja esitellään spatiaalista ääntä hyödyntäviä sovelluksia. Spatialisointia ja auralisaatiota voidaan tämän jälkeen tarkastella semioottisessa viitekehyksessä kuuntelijan näkökulmasta <a title="Luku 4" href="#ch-4">luvussa 4</a>.</p>
</div>
<div id="ch-3_1">
<h4>3.1 Äänen paikantaminen <a title="takaisin sisällysluetteloon" href="#toc-3_1">^</a></h4>
<p>Jauhiainen<sup id="ref-54_15" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 150)">[54]</a></sup> määrittelee <em>lokalisaation</em> äänen paikantamiseksi ilman kuulokkeita ja <em>lateralisaation</em> äänen paikantamiseksi kuulokkeita käyttämällä.  Lateralisaatio viittaa äänen paikantumiseen sivuun keskipisteestä, eli sijoittumista keskipisteestä jompaan kumpaan korvaan<sup id="ref-54_16" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 150)">[54]</a></sup>. Seuraavassa tarkastellaan niitä tekijöitä, joiden perusteella ääni paikannetaan tietystä suunnasta tulevaksi.</p>
<p>Vaihe-ero korvien välillä (interaural delay time, IDT) on merkittävä tekijä paikantamisessa<sup id="ref-29_0" class="ref"><a href="#note-29" title="(Burgess 1992b, 54)">[29]</a></sup>. Vaihe tarkoittaa värähtelyn ajankohtaa tiettynä hetkenä. Jos viivettä ei ole, ääni tulee suoraan edestä, takaa tai yläpuolelta. Jos ääni tulee sivulta, ääniaallot tulevat perille eri aikaan eri korvaan. Viive voi enimmillään olla 0.63 millisekuntia, jonka aikana ääni kulkee pään läpimitan pituisen matkan.<sup id="ref-29_1" class="ref"><a href="#note-29" title="(Burgess 1992b, 54)">[29]</a></sup>. Äänen voimakkuusero korvien välillä (interaural intensity difference, IID) on toinen merkittävä tekijä äänen paikantamisessa<sup id="ref-57_1" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>.</p>
<p>Jos ääni tulee sivusta, sen täytyy ennen toiseen korvaan etenemistään kiertää ensin pään ympäri. Pää imee itseensä osan ääniaalloista, joten alkuperäinen ääni tulee toiseen korvaan hieman vaimennettuna. Tätä ilmiötä kutsutaan pään aiheuttamaksi äänen vaimenemiseksi (head shadow effect).<sup id="ref-29_2" class="ref"><a href="#note-29" title="(Burgess 1992b, 54)">[29]</a></sup>. Samoin äänen tullessa takaa korvalehdet vaimentavat ääntä hieman verrattuna siihen, että ääni tulisi edestä<sup id="ref-50_1" class="ref"><a href="#note-50" title="(Goose &amp; Möller 1999, 365)">[50]</a></sup>. Alle 1500 Hz:n taajuiset ääniaallot ovat jo niin pitkiä, että ne taipuvat pään ympäri, jolloin voimakkuuseroa on vaikea havaita; paikantaminen tapahtuu tällöin pääasiassa vaihe-eron perusteella. Yli 1500 Hz:n taajuudet taas heijastuvat poispäin ja vaimentuvat pään vaikutuksesta, jolloin paikantaminen tehdään pääasiassa voimakkuuseron mukaan. 1500 Hz:n raja johtuu siitä, että 1500 Hz:n ääniaallon aallonpituus on sama kuin pään läpimitta.<sup id="ref-57_2" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Havaitsemme äänen sijainnin sivusuunnassa siis sekä vaihe- että voimakkuuseron perusteella.</p>
<p>Korvalehden ja -käytävän  merkitys (pinna and ear canal response) äänen paikantamisessa on kaksikorvaisuuden ohella ratkaiseva. Koska jo vaihe- ja voimakkuuseron perusteella paikannamme ääniä vaaka-akselilla, korvalehtiä tarvitaan oikeastaan vain äänten paikantamiseen pystyakselilla. Tämän lisäksi korvalehtiä tarvitaan luomaan vaikutelma siitä, että ääni todellakin tulee pään ulkopuolelta eikä sisältä. Korvalehdet ohjaavat äänen korvakäytävään, mutta samalla korvalehtien epäsäännöllinen muoto muuttaa äänen spektriä vaimentamalla ja voimistamalla tiettyjä taajuuksia äänen tulosuunnan ja kunkin ihmisen yksilöllisen anatomian mukaan. Tämän jälkeen aivot vertaavat ja tulkitsevat saatua tietoa äänen paikantamiseksi.<sup id="ref-57_3" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>.</p>
<p>Ihmisen yläruumis ja olkapäät heijastavat tiettyjä taajuuksia (shoulder echoes). Nämä heijastukset saapuvat korviin hieman myöhemmin riippuen äänen tulokulmasta. Myös tämä informaatio auttaa äänen tulosuunnan havainnoimisessa.<sup id="ref-29_3" class="ref"><a href="#note-29" title="(Burgess 1992b, 54)">[29]</a></sup>. On luonnollista, että käännämme päätämme halutessaan tarkemmin selvittää äänen suunnan. Jos käännämme päätämme sivulta tulevaa ääntä kohden, koemme äänen nyt tulevan keskeltä. Pään liikkeen avulla on siis mahdollista paikantaa ääni tarkemmin. Wun, Duhin, Ouhyoungin ja Wun<sup id="ref-83_0" class="ref"><a href="#note-83" title="(Wu, Duh, Ouhyoung ja Wu 1997, 17)">[83]</a></sup> tutkimuksen mukaan pään kääntäminen äänen suuntaan parantaa paikantamista 90 % verrattuna pään pitämiseen paikallaan. Esimerkiksi jos ääni tulee etuoikealta, vaihe- ja voimakkuuserot ovat samat, jolloin äänilähde voisi teoriassa olla &#8220;peilikuvaäänenä&#8221; myös takaoikealla<sup id="ref-12_0" class="ref"><a href="#note-12" title="(Begault 1991, 866)">[12]</a></sup>. Tilanne aiheuttaa epätietoisuutta, jos pää pidetään paikallaan. Pään kääntäminen oikealle poistaa heti peilikuvaäänen vaihe- ja voimakkuuserojen muuttuessa. Tällöin häviää epätietoisuus siitä, tuleeko ääni edestä vai takaa.</p>
<p>Myös näköaisti vaikuttaa paikantamiseen, joskin yllättävällä tavalla. Hylkäämme kuuloaistin tuoman informaation, jos se on ristiriidassa näkemämme äänilähteen sijainnin kanssa<sup id="ref-29_4" class="ref"><a href="#note-29" title="(Burgess 1992b, 55)">[29]</a></sup><sup id="ref-49_7" class="ref"><a href="#note-49" title="(Goldstein 1999, 242)">[49]</a></sup>. Uskomme siis mieluummin näkö- kuin kuuloaistia.</p>
<p>Huopaniemen<sup id="ref-53_1" class="ref"><a href="#note-53" title="(Huopaniemi 1999, 34)">[53]</a></sup> mukaan <em>huonekaiku</em> (room impulse response, RIR) voidaan jakaa suoraan ääneen, ensiheijastumiin ja jälkikaiuntaan. <em>Suora ääni</em> on ääni, joka saapuu korvaan suoraan heijastumatta ensin mistään pinnasta. <em>Ensiheijastumat</em> (early echo response) ovat ääniä, jotka saapuvat kuulijan korvaan 50&#8211;100 millisekunnin kuluessa äänen syntymisestä<sup id="ref-29_5" class="ref"><a href="#note-29" title="(Burgess 1992b, 55)">[29]</a></sup>. Binauraalinen (kaksikanavainen) huonekaiku (binaural room impulse response, BRIR) riippuu kuulijan ja äänilähteen sijainnista sekä huoneen ominaisuuksista tietyllä hetkellä<sup id="ref-58_0" class="ref"><a href="#note-58" title="(Kleiner, Dalenbeck &amp; Svensson 1993, 865)">[58]</a></sup>.</p>
<p><em>Jälkikaiunta</em> tarkoittaa ensiheijastuman jälkeisiä äänen heijastuksia. Huoneen kaikuisuutta mitataan jälkikaiunta-aikana (reverberation time), jota mitataan voimakkaalla lyhyellä äänipulssilla. Jauhiaisen<sup id="ref-54_17" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 38)">[54]</a></sup> mukaan jälkikaiunta-aika on aika, joka kuluu äänitason pienenemiseen 60 dB:iin käytetyn äänipulssin huippuarvosta. Suora ääni tulee ensimmäisenä suoraan kuulijan korvaan, ja kaikki ensi- ja jälkiheijastumat saapuvat tämän jälkeen eri aikoihin ja eri suunnista. Suoran äänen perusteella saamme vihjeitä äänilähteen suunnasta ja heijastumien määrän sekä äänen voimakkuuden perusteella äänen etäisyydestä ja tilan ominaisuuksista.<sup id="ref-29_6" class="ref"><a href="#note-29" title="(Burgess 1992b, 57)">[29]</a></sup><sup id="ref-57_4" class="ref"><a href="#note-4" title="(Kendall 1995)">[57]</a></sup><sup id="ref-63_0" class="ref"><a href="#note-63" title="(McGrath 1995, 1--2)">[63]</a></sup>.</p>
<p>Äänilähteen liikkuessa sen suunta ja etäisyys muuttuvat. <em>Doppler-ilmiö</em> (doppler-effect) syntyy, kun kohteen lähestyessä ääniaallot tihentyvät, jolloin aallonpituus lyhenee ja äänen korkeus nousee. Vastaavasti kohteen loitontuessa ääniaallot harventuvat, jolloin äänen korkeus laskee. Tästä voimme päätellä, että äänilähde liikkuu. Mitä nopeammin äänilähde liikkuu suoraan meitä kohti tai meistä poispäin lähietäisyydellä, sitä suurempi on äänen korkeuden muutos. Näin voimme saada tietoa äänilähteen etäisyydestä ja suunnasta.<sup id="ref-71_7" class="ref"><a href="#note-71" title="(Schafer 1977, 80)">[71]</a></sup><sup id="ref-13_1" class="ref"><a href="#note-13" title="(Begault 1994, 40)">[13]</a></sup>.</p>
<p>Äänen paikantamiseen vaikuttavat siis vaihe- ja voimakkuuserot korvien välillä, pään aiheuttama äänen vaimeneminen, korvalehden ja korvakäytävän muoto, heijastumat olkapäistä ja yläruumiista, pään liike, näköaisti, suora ääni, ensiheijastumat, jälkikaiunta-aika, äänilähteen liikkuminen ja Dopplerin ilmiö. Näiden tekijöiden vaikutukset äänen spektriin ovat mitattavissa siirtofunktion avulla. Siirtofunktion määrittelemisen jälkeen esitetään menetelmä, jolla ääneen lisätään keinotekoisesti vihjeitä tilasta ja suunnasta.</p>
</div>
<div id="ch-3_2">
<h4>3.2 Siirtofunktio <a title="takaisin sisällysluetteloon" href="#toc-3_2">^</a></h4>
<p>Begaultin<sup id="ref-12_1" class="ref"><a href="#note-12" title="(Begault 1991, 864)">[12]</a></sup> mukaan <em>siirtofunktion</em> (head related transfer function, HRTF) avulla saadaan selville, miten äänen spektri muuttuu äänen kulkiessa pään ulkopuolisesta äänilähteestä ulkokorvan läpi tärykalvolle. Siirtofunktio on erilainen kummassakin korvassa, ja se määritetään mittaamalla tärykalvoon saapuvan äänen spektrin muutokset verrattuna äänilähteestä lähtevän äänen spektriin. Tällöin voidaan tietokoneen avulla laskea alkuperäisen signaalin ja koehenkilön korviin tulevan signaalin perusteella kyseisen henkilön siirtofunktiot kunkin äänilähteen suhteen. Siirtofunktio vaihtelee äänilähteen sijainnin ja kuulijan pään asennon välisen suhteen mukaan kullakin hetkellä.<sup id="ref-12_2" class="ref"><a href="#note-12" title="(Begault 1991, 864)">[12]</a></sup><sup id="ref-57_5" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>.</p>
<p>Aina ei ole mahdollista mitata jokaisen yksilöllisen käyttäjän siirtofunktioita. Myös yleisen, keskiarvoisen siirtofunktion avulla päästään todentuntuisiin tuloksiin paikantamisessa (parhaiten kuitenkin vaaka-akselilla)<sup id="ref-12_3" class="ref"><a href="#note-12" title="(Begault 1991, 865)">[12]</a></sup><sup id="ref-81_0" class="ref"><a href="#note-81" title="(Wenzel, Wightman &amp; Kistler 1991, 358)">[81]</a></sup><sup id="ref-50_2" class="ref"><a href="#note-50" title="(Goose &amp; Möller 1999, 365)">[50]</a></sup>. Keskiarvoinen siirtofunktio on määritetty mittaamalla se suurelta määrältä ihmisiä ja laskemalla keskiarvo. Toinen mahdollisuus on käyttää keskimääräistä paremman &#8220;paikantajan&#8221; siirtofunktiota<sup id="ref-12_4" class="ref"><a href="#note-12" title="(Begault 1991, 865)">[12]</a></sup>. Mittaukset tehdään yleensä kaiuttomassa huoneessa eri suunnista tulevilla äänillä laajalla taajuusalueella<sup id="ref-63_1" class="ref"><a href="#note-63" title="(McGrath 1995, 3)">[63]</a></sup>.</p>
</div>
<div id="ch-3_3">
<h4>3.3 Äänen synteettinen spatialisointi <a title="takaisin sisällysluetteloon" href="#toc-3_3">^</a></h4>
<p><em>Spatialisointi</em> tarkoittaa Goosen ja Möllerin<sup id="ref-50_3" class="ref"><a href="#note-50" title="(Goose ja Möller 1999, 363)">[50]</a></sup> mukaan äänen prosessointia siten, että ääni koetaan tulevan kolmiulotteisesta äänikentästä (tietystä tunnistettavasta suunnasta) kuulijan ulkopuolelta. Burgessin<sup id="ref-28_0" class="ref"><a href="#note-28" title="(Burgess 1992a, 2)">[28]</a></sup><sup id="ref-29_7" class="ref"><a href="#note-29" title="(1992b, 53)">[29]</a></sup> mukaan digitaalinen monauraalinen ääni voidaan keinotekoisesti spatialisoida binauraaliseksi ääneksi digitaalisten suodatinalgoritmien avulla, kun tiedetään joko yksilöllinen tai keskiarvoinen siirtofunktio. Tätä kutsutaan synteettiseksi spatialisoinniksi.</p>
<p>Sekä stereoääni että binauraalinen ääni viittaavat kahden kanavan käyttöön, mutta poikkeavat äänitystekniikoiltaan ja äänentoisto-ominaisuuksiltaan toisistaan (monauraalinen viittaa yhden kanavan käyttöön). Burgessin<sup id="ref-28_1" class="ref"><a href="#note-28" title="(Burgess 1992a, 1)">[28]</a></sup><sup id="ref-29_8" class="ref"><a href="#note-29" title="(1992b, 53)">[29]</a></sup> mukaan stereoäänitys tarkoittaa monilla toisistaan erossa olevilla mikrofoneilla tehtyä äänitystä, jota kuunnellessaan kuulija voi havaita äänilähteen sijainnin äänikentässä. Tällöin sijainti on kuitenkin rajoitettu siihen vaakasuoraan linjaan, joka muodostuu kahden kaiuttimen välille tai kuulijan vasemman ja oikean korvan välille kuulokkeilla kuunneltaessa (ääni ei siis tunnu kuuluvan riittävästi pään ulkopuolelta)<sup id="ref-57_6" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Stereoäänitys ei kaksiulotteisena vastaa reaalitodellisuudessa korviimme tulevaa ääntä, koska se sisältää vain alkeellisen syvyysvaikutelman (lähellä&#8211;kaukana) ja leveysvaikutelman (vasen&#8211;oikea). Kolmiulotteinen ääni (three-dimensional sound) luo illuusion syvyyden ja leveyden lisäksi myös korkeudesta.</p>
<p>Kuulija voi siis paikantaa ääniä kaikista suunnista oman päänsä ulkopuolelta, myös edestä ja takaa<sup id="ref-83_1" class="ref"><a href="#note-83" title="(Wu ym. 1997, 16)">[83]</a></sup>. Olemme jatkuvasti tällaisen akustisen kolmiulotteisen äänikentän ympäröimänä. Binauraalinen äänitys ei ole sidottu vertikaaliseen linjaan (toisin kuin stereossa), vaan äänet tuntuvat tulevan tietystä paikasta pään ulkopuolelta. Binauraalinen äänitys kuulostaa realistisemmalta kuin stereoäänitys. Binauraalinen ääni voidaan Jot&#8217;n<sup id="ref-56_0" class="ref"><a href="#note-56" title="(Jot 1997, 56)">[56]</a></sup> mukaan toteuttaa kahdella tavalla: (a) äänittämällä äänitapahtuma omassa akustisessa ympäristössään tai (b) syntetisoimalla virtuaalinen äänitapahtuma. KUVIOSSA 2 on havainnollistettu binauraalisen äänen nauhoitusta ja toistoa (kohta (a))<sup id="ref-63_2" class="ref"><a href="#note-63" title="(McGrath 1995, 3)">[63]</a></sup>, ja KUVIOSSA 3 siirtofunktioiden mittausta ja simulointia (kohta (b))<sup id="ref-63_3" class="ref"><a href="#note-63" title="(McGrath 1995, 3)">[63]</a></sup>.</p>
<p><img id="figure-2" src="http://www.akikoo.org/wp-content/themes/aksu/images/bin_rec.png" alt="Binauraalinen äänitys ja toisto" /></p>
<h5>KUVIO 2. Binauraalinen äänitys ja toisto <a title="takaisin sisällysluetteloon" href="#toc-figure_2">^</a></h5>
<p>Ensiksi mainitussa tapauksessa äänitys tehdään joko lähimikityksellä tai keinopään (dummy head, artificial head) tai koehenkilön korvakäytäviin asennetuilla mikrofoneilla. Tällöin äänitapahtuma sisältää sekä paikantamiseen että huonekaikuun liittyvät elementit. Menettely kuitenkin hankaloittaa äänen jälkikäsittelyä. Kun taas äänitapahtuma on synteettinen, paikantamiseen ja tilan akustisiin ominaisuuksiin liittyvät parametrit lisätään ääneen signaalinprosessoinnin avulla keinotekoisesti, äänittämisen jälkeen siirtofunktion avulla<sup id="ref-57_7" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Äänen binauraalisen käsittelyn avulla voidaan siis luoda kolmiulotteinen äänikenttä kahden kanavan avulla<sup id="ref-56_1" class="ref"><a href="#note-56" title="(Jot 1997, 60)">[56]</a></sup>.</p>
<p><img id="figure-3" src="http://www.akikoo.org/wp-content/themes/aksu/images/hrtf.png" alt="Siirtofunktioiden  mittaus ja simulointi" /></p>
<h5>KUVIO 3. Siirtofunktioiden  mittaus ja simulointi <a title="takaisin sisällysluetteloon" href="#toc-figure_3">^</a></h5>
<p>Burgess<sup id="ref-29_9" class="ref"><a href="#note-29" title="(Burgess 1992b, 55)">[29]</a></sup> kuvaa spatialisointiprosessia seuraavassa esitettävällä tavalla: Kutakin äänilähteen koordinaattia pysty- ja vaakatasolla vastaa yksi siirtofunktio-suodatinpari kumpaakin korvaa varten. Jotta kuulija voi sijoittaa äänen tiettyyn paikkaan äänikentässä, kyseinen ääni on prosessoitava vastaavalla suodatinparilla. Burgess<sup id="ref-29_10" class="ref"><a href="#note-29" title="(Burgess 1992b, 55)">[29]</a></sup> esittää <em>silmukka-algoritmin äänten reaaliaikaiselle spatialisoinnille:</em></p>
<p>Prosessi 1:</p>
<ul>
<li>päivitä äänen sijainti</li>
<li>hanki halutut vaaka- ja pystykoordinaatit</li>
<li>etsi lähimmät siirtofunktio-suodatinparit</li>
<li>hanki haluttu suodatinpari</li>
<li>lähetä suodatinpari prosessi 2:seen</li>
</ul>
<p>Prosessi 2:</p>
<ul>
<li>käytä suodatinta</li>
<li>jaa monauraalinen lähdesignaali binauraaliseksi</li>
<li>lisää vasen  ja oikea suodatin signaaleihin</li>
<li>konvertoi äänikanavat analogisiksi ja soita ääni</li>
<li>korvaa nykyinen suodatinpari uudella (takaisin prosessiin 1)</li>
</ul>
<p>Burgessin<sup id="ref-29_11" class="ref"><a href="#note-29" title="(Burgess 1992b, 53)">[29]</a></sup> mukaan uudet digitaaliset signaaliprosessorit mahdollistavat jo reaaliaikaisen spatialisoinnin. Prosessissa 2 jokainen yksittäinen monauraalinen ääni siis jaetaan oikealle ja vasemmalle kanavalle, jonka jälkeen saadut stereoparit prosessoidaan halutulla suodattimella. Lopuksi kaikki valmiit stereoparit summataan yhdeksi stereotulosteeksi, joka toistetaan joko kuulokkeilla tai kaiuttimilla. Prosessi vaatii koneelta erittäin paljon laskutehoa, varsinkin jos tarkoituksena on luoda monipuolinen useista yksittäisistä äänilähteistä muodostunut kolmiulotteinen äänikenttä.</p>
<p>Alten<sup id="ref-3" class="ref"><a href="#note-3" title="(Alten 1999, 417)">[3]</a></sup> mainitsee stereoäänen ja kolmiulotteisen (binauraalisen) äänen lisäksi vielä <em>surround-äänen</em> menetelmänä luoda spatiaalinen äänikenttä. Kolmiulotteinen surround-ääni saadaan aikaan sijoittamalla kaiuttimia eri puolille kuulijaa. Tällaiseen monikaiutinjärjestelmään ei kuitenkaan tässä tutkimuksessa puututa, vaan spatialisoidun äänen toisto rajoitetaan tapahtuvaksi kuulokkeilla tai vaihtoehtoisesti kahdella kaiuttimella (ks. <a title="kohta 3.5" href="#ch-3_5">kohta 3.5</a>). Spatialisointi on siis menettelytapa, jolla luodaan kolmiulotteinen äänikenttä, josta voidaan erottaa ja paikantaa äänilähteitä eri suunnissa. Kun äänet on spatialisoitu, kuulija voi erottaa äänikentästä eri lähteitä, keskittyä niihin ja sivuuttaa muut.</p>
<p>Asia erikseen on &#8220;mentaalinen&#8221; spatialisaatio. Chionin<sup id="ref-33_17" class="ref"><a href="#note-33" title="(Chion 1990, 69)">[33]</a></sup> mukaan perinteisessä monauraalisessa elokuvassa sijainti, josta ääni fyysisesti tulee, ei ole sama kuin mistä se koetaan tulevan. Esimerkiksi jos henkilö elokuvassa kävelee ruudun halki, askeleet koetaan kuuluvan ja seuraavan henkilöä, vaikka ne todellisuudessa kuuluvat samasta staattisesta kaiuttimesta.<sup id="ref-33_18" class="ref"><a href="#note-33" title="(Chion 1990, 69)">[33]</a></sup>. Tällöin spatiaalisuus koetaan äänen ja kuvan yhteisvaikutuksena mielen tasolla, ei fyysisesti (ks. audiovisuaalinen sopimus, <a title="kohta 2.4" href="#ch-2_4">kohta 2.4</a>).</p>
</div>
<div id="ch-3_4">
<h4>3.4 Auralisaatio  <a title="takaisin sisällysluetteloon" href="#toc-3_4">^</a></h4>
<p><em>Auralisaatio</em> on visualisaation vastine kuuloaistin alueella<sup id="ref-63_4" class="ref"><a href="#note-63" title="(McGrath 1995, 1)">[63]</a></sup>. Begaultin<sup id="ref-13_2" class="ref"><a href="#note-13" title="(Begault 1994, 145)">[13]</a></sup> mukaan auralisaatiossa luodaan jokin akustinen virtuaalitila huonekaiun mallintamisen ja synteettisen spatialisoinnin avulla. Siirtofunktio-suodattimilla prosessoidaan sekä suora ääni että heijastuneet äänet. Kendallin<sup id="ref-57_8" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup> mukaan etäisyys- ja tilavaikutelma luodaan ääneen kontrolloimalla ensiheijastumien ja jälkikaiunnan määrää. Kleiner ym.<sup id="ref-58_1" class="ref"><a href="#note-58" title="(Kleiner ym. 1993, 861)">[58]</a></sup> ovat määritelleet auralisaation seuraavasti:</p>
<blockquote>
<p class="quote">Auralization is the process of rendering audible, by physical or mathematical modeling, the sound field of a source in a space, in such a way as to simulate the binaural listening experience at a given position in the modeled space.</p>
<p class="author">Kleiner ym. (1993, 861)</p>
</blockquote>
<p>Tavoitteena auralisaatiossa on siis luoda vaikutelma jonkin tilan akustisista ominaispiirteistä, siihen liittyvistä äänistä sekä niiden sijainnista äänikentässä riippuen kuulijan sen hetkisestä sijainnista kyseisessä tilassa. Tämä tila voi olla joko jonkin olemassaolevan paikan virtuaalinen vastine tai täysin kuviteltu tila. Äänimateriaali suodatetaan ja prosessoidaan digitaalisesti, jolloin tuloksena on edellämainittu illuusio, joka on luotu tietyn paikan akustisten tunnuspiirteiden avulla.<sup id="ref-58_2" class="ref"><a href="#note-58" title="(Kleiner ym. 1993, 861)">[58]</a></sup>. Auralisaatiojärjestelmä koostuu yksinkertaisimmillaan äänilähteestä, tilasta ja kuulijasta, jotka on mallinnettava erikseen<sup id="ref-58_3" class="ref"><a href="#note-58" title="(Kleiner ym. 1993, 862)">[58]</a></sup><sup id="ref-13_3" class="ref"><a href="#note-13" title="(Begault 1994, 4)">[13]</a></sup>. Siinä missä spatialisoinnilla tarkoitetaan äänen teknistä prosessointimenetelmää, auralisaatiolla viitataan tässä tutkimuksessa kattavampaan prosessiin, joka pitää sisällään koko äänimaiseman mallintamisen. Käyttöliittymässä oleellista on, että mallinnus tähtää tehokkaaseen vuorovaikutukseen ja tavoitteelliseen toimintaan.</p>
</div>
<div id="ch-3_5">
<h4>3.5 Kaiutin- ja kuulokeäänentoiston vastakkainasettelu <a title="takaisin sisällysluetteloon" href="#toc-3_5">^</a></h4>
<p>Ongelmana kaiutinäänentoistossa on, että vasemmasta kaiuttimesta kuuluva ääni havaitaan myös oikeassa korvassa ja toisinpäin (crosstalk)<sup id="ref-53_2" class="ref"><a href="#note-53" title="(Huopaniemi 1999, 30)">[53]</a></sup>. Ongelmaa on pyritty minimoimaan kehittämällä tekniikoita ristikkäisten signaalien eliminoimiseksi (crosstalk cancelled binaural processing). Huopaniemi<sup id="ref-53_3" class="ref"><a href="#note-53" title="(Huopaniemi 1999, 30)">[53]</a></sup> mainitsee kaksi rajoitusta binauraalisessa kaiutinkuuntelussa: ensinnäkin kuulijan on oltava paikallaan ja toiseksi kuunteluhuoneen on oltava mahdollisimman kaiuton. Kendallin<sup id="ref-57_9" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup> mukaan 1 millisekunnin aikana tulevat heijastukset tuhoavat siirtofunktion vaikutuksen, joten heijastukset kaiuttimien ja kuulijan lähellä on eliminoitava.</p>
<p>Kolmiulotteinen spatialisointi kaiuttimilla toistettaessa onnistuu siis parhaiten silloin, kun kuulijan sijainti kaiuttimiin nähden on etukäteen tiedossa ja pysyy samana koko ajan. Tämä viittaisi siihen, että kolmiulotteista ääntä voitaisiin käyttää kotitietokoneeseen liitettyjen kahden kaiuttimen avulla, koska tietokoneen käyttäjä istuu koko ajan paikallaan. Ongelmana ovat kuitenkin suuret tehovaatimukset ja kaiun eliminointi kotioloissa. &#8220;Crosstalkin&#8221; luotettava eliminointi voisi lisätä kaksikanavaisen, kolmiuloitteisen äänentoiston mahdollisuuksia multimediakäyttöliittymissä ja kotikoneissa<sup id="ref-56_2" class="ref"><a href="#note-56" title="(Jot 1997, 62)">[56]</a></sup>. Kaiutinkuuntelu on helpompi toteuttaa kuin kuulokekuuntelu, mutta se ei tuota yhtä luotettavaa tulosta. Kaiutinkuuntelun onnistuminen riippuu Jot&#8217;n<sup id="ref-56_3" class="ref"><a href="#note-56" title="(Jot 1997, 60)">[56]</a></sup> mukaan ainakin käytetystä tekniikasta, simuloitavien äänten suunnista, kaiuttimien suuntaavuudesta sekä kuunteluhuoneen koosta ja akustisista ominaisuuksista. Kaiutinkuuntelussa paikantaminen etualalla on huomattavasti helpompaa kuin paikantaminen takana tai yläpuolella<sup id="ref-56_4" class="ref"><a href="#note-56" title="(Jot 1997, 62)">[56]</a></sup>.</p>
<p>Etuna kuulokeäänentoistossa taas on, että kuunteluhuoneen akustiikka tai kuulijan sijainti huoneessa eivät vaikuta kuulokokemukseen<sup id="ref-53_4" class="ref"><a href="#note-53" title="(Huopaniemi 1999, 30)">[53]</a></sup>. Kuulokkeet myös mahdollistavat spatiaalisen äänilähteen sijainnin tarkemman kontrollin<sup id="ref-81_1" class="ref"><a href="#note-81" title="(Wenzel ym. 1991, 351)">[81]</a></sup><sup id="ref-63_5" class="ref"><a href="#note-63" title="(McGrath 1995, 4)">[63]</a></sup><sup id="ref-14" class="ref"><a href="#note-14" title="(Begault 1999, 14)">[14]</a></sup>. Kendallin<sup id="ref-57_10" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup> mielestä haittana voi kuitenkin olla se, että huolimatta vaihe- ja voimakkuuseroista ääntä ei koeta tulevan riittävästi pään ulkopuolelta, vaan ääni vain lateralisoituu joko vasempaan tai oikeaan kuulokkeeseen. Toinen ongelma on etu- ja taka-alan sekoittaminen, jota kuitenkin voidaan vähentää liioittelemalla huomattavasti niitä äänen spektraalisia muunnoksia, joita edessä ja takana olevat äänilähteet aiheuttavat<sup id="ref-57_11" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Kuulokekuuntelun avulla voidaan luoda luonnollisen tuntuinen kolmiulotteinen äänikenttä, mutta haittana on kallis ja monimutkainen toteutus. Tekniikan kehittyessä tämä ongelma poistunee, jolloin myös kaupallisissa sovelluksissa voidaan kuulla hyvätasoista spatiaalista ääntä.</p>
</div>
<div id="ch-3_6">
<h4>3.6 Äänen spatialisoinnin ongelmat <a title="takaisin sisällysluetteloon" href="#toc-3_6">^</a></h4>
<p>Suurimmat haasteet kolmiulotteisen äänikentän toteuttamisessa ovat Begaultin<sup id="ref-12_5" class="ref"><a href="#note-12" title="(Begault 1991, 865">[12]</a></sup> ja Kleinerin ym.<sup id="ref-58_4" class="ref"><a href="#note-58" title="(Kleiner ym. 1993, 865">[58]</a></sup> mukaan seuraavat: edessä ja takana olevien peilikuvaäänten poistaminen, paikantamisvirheiden minimointi, ihmisen havaintokyvylle riittävän siirtofunktiomittaustason saavuttaminen mahdollisimman pienellä datamäärällä sekä ratkaisun löytäminen mitattujen siirtofunktioiden ja havaitun kuulokuvan välillä vallitseviin ristiriitoihin.</p>
<p>Kuulijan voi olla vaikea paikantaa ääni edestä tai takaa tulevaksi<sup id="ref-29_12" class="ref"><a href="#note-29" title="(Burgess 1992b, 56)">[29]</a></sup>. Kendallin<sup id="ref-57_12" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup> mukaan nämä paikantamisvaikeudet pystyakselilla johtuvat korvien saamasta yhtäsuuresta vaihe- ja voimakkuusinformaatiosta, eli peilikuvaäänestä. Tällöin paikantaminen perustuu vähäisiin spektraalisiin eroihin siirtofunktion perusteella<sup id="ref-12_6" class="ref"><a href="#note-6" title="(Begault 1991, 866)">[12]</a></sup><sup id="ref-54_18" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 152)">[54]</a></sup><sup id="ref-57_13" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Burgessin<sup id="ref-29_13" class="ref"><a href="#note-29" title="(Burgess 1992b, 57)">[29]</a></sup> mukaan pääasialliset vihjeet äänen sijainnista kuulijan edessä tai takana saadaan pään kääntämisen ja korvalehtien vaikutuksen perusteella. Myös simuloidun huoneen ensiheijastumien lisääminen spatialisoituun ääneen helpottaa Burgessin<sup id="ref-29_14" class="ref"><a href="#note-29" title="(Burgess 1992b, 57)">[29]</a></sup> mukaan äänen paikantumista eteen tai taakse.</p>
<p>Näitä paikantamiseen liittyviä ongelmia voidaan huomattavasti vähentää, jos spatialisaatiojärjestelmään liitetään erityinen laite, joka tarkkailee pään asentoa<sup id="ref-63_6" class="ref"><a href="#note-63" title="(McGrath 1995, 5)">[63]</a></sup>. Tällainen &#8220;head tracker&#8221; välittää tiedot pään asennosta tietokoneelle, joka päivittää samanaikaisesti suodatinparien suuntatiedot. Näin kuulija kokee päätä kääntäessään äänilähteen pysyvän koko ajan samassa paikassa<sup id="ref-57_14" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Tällä tavalla voidaan todellisuutta jäljentämällä lisätä kokemusta, että ääni tulee pään ulkopuolelta. Jos ääntä ei koeta tulevan riittävän vahvasti pään ulkopuolelta, se saattaa johtua epätarkasti mitatusta siirtofunktiosta<sup id="ref-29_15" class="ref"><a href="#note-29" title="(Burgess 1992b, 56)">[29]</a></sup>.</p>
<p>Synteettisesti spatialisoitu äänikenttä &#8212; virtuaalinen kuulokokemus &#8212; voi poiketa suurestikin jäljiteltävästä akustisesta kuulokokemuksesta. Virheitä voi esiintyä joko äänilähteen, tilan tai kuuntelijan mallinnuksessa. Kolme keskeisintä paikantamisvirheiden aiheuttajaa ovat epätarkat siirtofunktiot, käytettävien äänten erilaiset ominaispiirteet (esim. taajuus ja voimakkuus) sekä järjestelmän spatiaalinen erotuskyky<sup id="ref-12_7" class="ref"><a href="#note-12" title="(Begault 1991, 865)">[12]</a></sup>. Begault<sup id="ref-12_8" class="ref"><a href="#note-12" title="(Begault 1991, 865)">[12]</a></sup>toteaa myös, että vaikka nämä kaikki kolme tekijää olisivatkin kunnossa, ongelmia voi silti aiheuttaa kuulijoiden vaihteleva paikantamiskyky. Useimmiten on tyydyttävä kompromissiin ja käytettävä keskimääräisiä siirtofunktioita. Lukemattomien yksittäisten äänten spatialisaatio eri puolille kolmiuloitteista äänikenttää vaatii tietokoneelta suurta suorituskykyä. Päämääränä spatialisoinnissa on pidettävä riittävän tarkkaa akustisen ympäristön virtuaalitoistoa mahdollisimman pienellä datamäärällä. Akustista tilaa ei tietenkään aina tarvitse edes täyttää. Kuten Chion<sup id="ref-33_19" class="ref"><a href="#note-33" title="(Chion 1990, 154)">[33]</a></sup> sanoo: spatiaalisuus suurentaa sitä tilaa, joka mahdollisesti voidaan täyttää äänillä. Tällöin päästään Blyn<sup id="ref-18_1" class="ref"><a href="#note-18" title="(Bly 1982, 375)">[18]</a></sup> mainitsemaan uuteen ulottuvuuteen. Seuraavassa kohdassa käsitellään tätä uutta ulottuvuutta muutaman sovelluksen kautta.</p>
</div>
<div id="ch-3_7">
<h4>3.7 Spatiaalista ääntä hyödyntäviä sovelluksia <a title="takaisin sisällysluetteloon" href="#toc-3_7">^</a></h4>
<p>Akustinen ekologia sopii hyvin lähtökohdaksi käyttöliittymäsuunnittelulle, koska spatiaalinen ääni kuuluu luonnolliseen ääniympäristöömme. Käyttöliittymäsuunnittelija ei kuitenkaan ole sidottu fyysiseen ääniympäristöön<sup id="ref-60_8" class="ref"><a href="#note-60" title="(Kramer 1994, 56)">[60]</a></sup>. Tietokonepeleissä on käytetty jonkin verran kolmiulotteista ääntä, joskin Goosen ja Möllerin<sup id="ref-50_4" class="ref"><a href="#note-50" title="(Goose ja Möller 1999, 366)">[50]</a></sup> mukaan näitä ääniefektejä on käytetty lähes yksinomaan tunnelman luomiseen, eikä peleissä ole juurikaan hyödynnetty äänten spatialisointia. Spatialisoinnin avulla voidaan kuitenkin tarjota lisäinformaatiota ja lisätä pelin todentuntuisuutta. Wenzelin ym.<sup id="ref-81_2" class="ref"><a href="#note-81" title="(Wenzel ym. 1991, 351)">[81]</a></sup> ja Wenzelin<sup id="ref-80_0" class="ref"><a href="#note-80" title="(Wenzel 1994, 38)">[80]</a></sup> mukaan spatiaalisen äänen käytöllä on ainakin kaksi etua: (a) objektien ja niiden välisten suhteiden havaitseminen kolmiulotteisessa tehtäväavaruudessa ja (b) useiden äänivirtojen havaitseminen samanaikaisesti, jolloin kuulija voi vaihdella huomiotaan eri äänivirtojen kesken. Tällöin siis yhdistetään objektien merkityksiä ja suuntatietoa. Tätä seikkaa on käytetty hyväksi jo useissa sovelluksissa ja prototyypeissä, joista seuraavassa esitellään tärkeimmät.</p>
<p>&#8220;AudioStreamer&#8221;-sovellus perustuu äänen spatiaaliselle erottelulle ja samanaikaiselle kuuntelulle; käyttäjä voi päätään kääntämällä valita mieleisensä kanavan kolmesta vaihtoehdosta, jolloin kyseisen kanavan äänenvoimakkuus kasvaa<sup id="ref-72" class="ref"><a href="#note-72" title="(Schmandt &amp; Mullins 1995, 218)">[72]</a></sup>. Sovelluksessa käyttäjä siis kommunikoi käyttöliittymän kanssa pään liikkeiden avulla (manuaalisen käyttöliittymän sijaan), ja peräkkäinen äänentoisto on korvattu monikanavaisella äänentoistolla. Sovellus perustuu paikallaan pysyville äänilähteille. Sawhney ja Schmandt<sup id="ref-68_0" class="ref"><a href="#note-68" title="(Sawhney ja Schmandt 1997, 110)">[68]</a></sup> ovat käyttäneet radiota metaforana äänitiedostojen selaamisessa ja kokeilleet ajatuksiaan &#8220;Nomadic Radio&#8221;&#8211;prototyypissä. He esittelevät <em>kolme spatiaalisen kuuntelun toimintatilaa</em><sup id="ref-68_1" class="ref"><a href="#note-68" title="(Sawhney ja Schmandt 1997, 111)">[68]</a></sup>:</p>
<dl>
<dt><em>Lähetys:</em></dt>
<dd>viesti lähetetään tietystä sijainnista tilassa. Viesti on kuultavissa taka-alalla hetken ennen häipymistään kuulumattomiin, ellei käyttäjä reagoi siihen ennen sitä. Vertaus perustuu radion kuunteluun, jossa kuulija aktivoituu vasta sitten, kun kuulee mielenkiintoisen kohdan.</dd>
<dt><em>Selaus:</em></dt>
<dd>käyttäjä voi selata viestejä ja tuoda jonkun niistä etualalle. Tämä vertaus perustuu radiokanavien aktiiviseen kuunteluun ja selailuun, kunnes mieluisa kanava löytyy.</dd>
<dt><em>Vilkaiseminen:</em></dt>
<dd>Nopea katsaus kaikkiin viesteihin siirtämällä ne kuuntelualueen keskelle.</dd>
</dl>
<p>Radio-metafora vaikuttaa olevan käyttökelpoinen (vaikka siinä onkin lisäominaisuutena spatiaalisuus). Koska ääni on väliaikaista, sen avulla ei voi selata useita tiedostoja samalla tavalla kuin tekstiä ja kuvia näköaistin avulla <sup id="ref-59_0" class="ref"><a href="#note-59" title="(Kobayashi &amp; Schmandt 1997, 194)">[59]</a></sup><sup id="ref-68_2" class="ref"><a href="#note-68" title="(Sawhney &amp; Schmandt 1997, 109--110)">[68]</a></sup>. Äänen sijainnin avulla voidaan antaa tietoa viestin kategoriasta tai kiireellisyydestä<sup id="ref-68_3" class="ref"><a href="#note-68" title="(Sawhney &amp; Schmandt 1997, 109--110)">[68]</a></sup>. &#8220;Multimedia Browser&#8221;&#8211;prototyypissä Fernström ja Bannon<sup id="ref-39" class="ref"><a href="#note-39" title="(Fernström ja Bannon 1997)">[39]</a></sup> kokeilivat sijoittaa useita äänitiedostoja stereoäänikenttään niiden visuaalisen sijainnin mukaan näytöllä. Osoittamalla nuolella tiettyä visuaalista objektia, vastaava äänitiedosto soi samassa sijainnissa.</p>
<p>Kobayashi ja Schmandt<sup id="ref-59_1" class="ref"><a href="#note-59" title="(Kobayashi ja Schmandt 1997)">[59]</a></sup> kehittivät spatiaalisen käyttöliittymän (&#8220;Dynamic Soundscape&#8221;), joka perustuu äänen sijainnin muistamiselle ajassa. Eteen- ja takaisinkelauksen sijaan kuuntelija vaihtaa huomiotaan liikkuvien äänilähteiden kesken (jotka toistavat saman äänityksen eri kohtia samanaikaisesti), jolloin kuuntelija voi kytkeä tietyn ajankohdan äänitiedostosta tiettyyn sijaintiin<sup id="ref-59_2" class="ref"><a href="#note-59" title="(Kobayashi ja Schmandt 1997, 194)">[59]</a></sup>. Käyttäjä voi siten selata äänitapahtumia samoin kuin selaisi visuaalisia objekteja. Vaikka käyttäjä keskittyy yhteen äänitapahtumaan kerrallaan, hän kuulee muutkin äänitapahtumat taustalla. Sen sijaan, että käyttäjät ajattelisivat &#8220;aihe jonka kuulin 20 sekuntia sitten&#8221;, he voivat ajatella &#8220;aihe jonka kuulin takavasemmalta&#8221;. Tällä tavalla spatiaalisen muistin avulla korvataan ajallisen muistin heikkouksia.<sup id="ref-59_3" class="ref"><a href="#note-59" title="(Kobayashi ja Schmandt 1997, 196)">[59]</a></sup>.</p>
<p>Toteutuksessa oli kuitenkin muutamia ongelmia: kuuntelijoilla oli vaikeuksia muistaa äänityksen tietyn kohdan sijainti<sup id="ref-59_4" class="ref"><a href="#note-59" title="(Kobayashi &amp; Schmandt 1997, 196--198)">[59]</a></sup>. Muistamista vaikeutti ainakin se, että äänitapahtumat olivat liikkuvia. Mitä hitaammin äänitapahtumat liikkuivat, sitä paremmin kuuntelijat kytkivät kohdan sijaintiin. Toinen ongelma oli, että spatiaalisen muistin resoluutio on huono: voimme sanoa, että &#8220;kohde vasemmalla ylhäällä&#8221;, mutta emme että &#8220;kohde 38 astetta keskikohdasta vasemmalle&#8221;. Spatiaalinen sijainti voidaan muistaa vain ympyrän kahdestoistaosan tarkkuudella.<sup id="ref-59_5" class="ref"><a href="#note-59" title="(Kobayashi &amp; Schmandt 1997, 196--198)">[59]</a></sup>.</p>
<p>Tekijöiden idea on kuitenkin kehityskelpoinen: vastakkainasettelu (peräkkäisen) eteen- ja takaisinkelauksen ja selektiivisen (samanaikaisen) kuuntelun välillä tuntuu toimivan. Spatiaalinen esitys tarjoaa mahdollisuuden järjestellä informaatiota ja hyödyntää käyttäjän muistia paremmin. Goose ja Möller<sup id="ref-50_5" class="ref"><a href="#note-50" title="(Goose ja Möller 1999, 363)">[50]</a></sup> taas ovat esittäneet käsitteellisen mallin <abbr title="HyperText Markup Language">html</abbr>-dokumentin rakenteen kytkemiselle spatiaaliseen ääniavaruuteen. Mallissa on uutta se, että siinä pyritään ensi kertaa kytkemään dokumentin rakenne spatiaaliseen ääneen, tavanomaisen dokumentin sisällön sijaan. Walker ja Brewster<sup id="ref-76_1" class="ref"><a href="#note-76" title="(Walker ja Brewster 2000)">[76]</a></sup> ovat tutkineet spatiaalisen äänen käyttöä mobiileissa laitteissa ja kokeilleet spatialisoitua ääntä ja sijainnin muuttumista kuvaamaan tiedoston latautumista. He päättelivät, että spatiaalinen ääni lisäsi tarkkuutta taustaprosessin monitoroinnissa ja tehosti keskittymistä samanaikaisesti suoritettuun päätehtävään<sup id="ref-76_2" class="ref"><a href="#note-76" title="(Walker ja Brewster 2000, 12)">[76]</a></sup>.</p>
<p>Edellä esitetyn perusteella voidaan päätellä, että spatiaalinen ääni muodostaa mielenkiintoisen uuden ulottuvuuden käyttöliittymään, varsinkin yhdistettäessä visuaaliseen informaatioon. Luvussa on esitetty paikantamiseen vaikuttavat tekijät, korvan &#8220;hämäämiseen&#8221; perustuva synteettisen spatialisoinnin periaate sekä keskeisimmät ongelmat sen toteutuksessa. Sovelluksista voidaan kuitenkin päätellä, että vaikeudet ovat voitettavissa: 1990-luvun loppuun mennessä jo useat sovellukset ovat menestyksellisesti hyödyntäneet spatiaalista ääntä. Mikä parasta, nämä sovellukset ovat osoittaneet käytännön toteutuksen ja koehenkilöiden kokemuksien kautta ne kohdat, joissa on parantamisen varaa. Kehitettävää todellakin on, mutta tekniikan edistyessä ongelmaksi jää edelleen se, miten spatiaalista ääntä tulisi käyttää.</p>
<p>Spatiaalinen ääni muodostaa tavallaan kannettavan &#8220;kuplan&#8221; käyttäjän pään ympärille, jolloin informaatiota voidaan järjestellä laajemmalle alueelle kuin visuaalista informaatiota. Tämä spatiaalinen kupla voidaan jakaa pienemmiksi tiloiksi, jotka sisältävät paikallisia ja globaaleja merkityksellisiä ääniä.  Enkoodaamalla äänen parametri (tässä tapauksessa spatiaalinen ääni) kuhunkin ajassa olevaan pisteeseen, saadaan aikaan &#8220;laulu&#8221;, jota kuuntelemalla voidaan määritellä merkityksellisiä kohtia ja muutoksia<sup id="ref-18_2" class="ref"><a href="#note-18" title="(Bly 1982, 374)">[18]</a></sup>. Tämä on seuraavan luvun aihe.</p>
</div>
<div id="ch-4">
<h3>4. Äänimaisema-analyysi käyttöliittymässä <a title="takaisin sisällysluetteloon" href="#toc-4">^</a></h3>
<p>Tässä luvussa pyritään yhdistämään äänen suunnan tuottama merkityssisältö käyttöliittymän toimintoihin. Luvussa tarkastellaan äänen mahdollisia funktioita käyttöliittymässä, jonka jälkeen analysoidaan ääniä semioottisessa viitekehyksessä. Lopuksi tarkastellaan erilaisia äänten luokittelujärjestelmiä. Ensin on kuitenkin pohdittava hiljaisuuden merkitystä.</p>
</div>
<div id="ch-4_1">
<h4>4.1 Hiljaisuus <a title="takaisin sisällysluetteloon" href="#toc-4_1">^</a></h4>
<p>Kun näin kauan olemme puhuneet äänestä, on tarpeen käsitellä ei-ääntä: hiljaisuutta. Chion<sup id="ref-33_20" class="ref"><a href="#note-33" title="(Chion 1990, 57)">[33]</a></sup> korostaa, että hiljaisuus ei ole koskaan neutraalia tyhjyyttä; se on aiemmin kuullun tai odotetun, kuvitellun äänen negatiivi. Kun hiljaisuus ennakoi ääntä, hermostunut odotus tekee sen eläväksi; kun taas hiljaisuus keskeyttää äänen tai seuraa sitä, hiljaisuus on täynnä sitä edeltäneen äänen jälkivaikutusta niin kauan, kuin muisti jaksaa sitä sellaisena pitää<sup id="ref-71_8" class="ref"><a href="#note-71" title="(Schafer 1977, 257)">[71]</a></sup>. Näin ääni siis luo kontrasteja. Länsimaisessa kirjallisuudessa hiljaisuus on kuitenkin usein kuvattu ahdistavaksi, yksinäiseksi tai raskaaksi, vain harvoin täyttymyksen tai tyytyväisyyden tilaksi tai muuten positiiviseksi ilmiöksi<sup id="ref-71_9" class="ref"><a href="#note-71" title="(Schafer 1977, 146)">[71]</a></sup>. Schaferin<sup id="ref-71_10" class="ref"><a href="#note-71" title="(Schafer 1977, 256)">[71]</a></sup> mielestä länsimaiselle ihmiselle hiljaisuus on negatiivista; se pitää rikkoa vaikka väkisin. Toisaalta absoluuttista hiljaisuutta ei ole olemassakaan, koska aina on jotain, joka aiheuttaa ääntä.</p>
<p>Gaverin &#8220;SonicFinder&#8221; oli menestys: totuttuaan siihen käyttäjät valittivat äänten puuttumista käyttäessään äänetöntä versiota<sup id="ref-43_5" class="ref"><a href="#note-43" title="(Gaver 1989, 82)">[43]</a></sup>. Äänikäyttöliittymään voi siis tottua. Onko meidät kuitenkin pakotettu tottumaan äänettömään käyttöliittymään ja sen piinaavaan, yksinäiseen hiljaisuuteen; hiljaisuuteen joka on vain tyhjä negatiivi ilman informaatioarvoa? Kun käyttöliittymä jaetaan äänettömyyteen ja kuuluvuuteen, myös hiljaisuus saa uuden merkityksen. Jälleen päästään kontekstiin: hiljaisuus merkitsee eri asioita eri konteksteissa. Oleellista on se, että tehdään selvä ero hiljaisuuden ja äänen välillä. On aika olla hiljaa ja aika olla äänekäs.</p>
<p>Buxtonin<sup id="ref-30" class="ref"><a href="#note-30" title="(Buxton 1989)">[30]</a></sup> mukaan ihmiset saattavat vastustaa äänen käyttöä käyttöliittymässä perustellen sitä seuraavasti: &#8220;Työskentelen hälyisässä toimistossa, enkä halua enää enempää melua häiritsemään työtäni&#8221;<sup id="ref-35_2" class="ref"><a href="#note-35" title="(Cohen 1994, 513)">[35]</a></sup>. Buxton vastaa sanomalla, että ääni on jo muutenkin läsnä kaikkialla ja että jos kontrolloisimme paremmin ääniympäristöämme, saisimme kokonaisäänimaiseman vähemmän vastenmieliseksi. Ihmiset suhtautuvat siis ääneen kaksijakoisesti: joko vastustavat sitä voimakkaasti tai suhtautuvat todella innokkaasti. Sitä paitsi meluisassa toimistossakin voi käyttää kuulokkeita, jotka eivät sulje pois toimiston muita tärkeitä ääniä. Brewster<sup id="ref-21_1" class="ref"><a href="#note-21" title="(Brewster 1994, 6)">[21]</a></sup> korostaa, että jos äänet ovat informatiivisia, käyttäjät eivät halua laittaa niitä pois päältä. Onkin mielenkiintoista, että äänen osuutta käyttöliittymässä kuvataan usein adjektiivilla &#8220;häiritsevä&#8221;. Jos käyttöliittymän äänet ovat huonosti suunniteltuja, niitä saatetaan pitää myös &#8220;huvittavina&#8221;. Tällaiset määritelmät osoittavat, että paljon on vielä tekemättä sekä asenteiden että tekniikan osalta. Harvemmin graafisia elementtejä pidetään häiritsevinä. Selvää kuitenkin on, että visuaalisesti liian täynnä oleva näyttö ei ole lainkaan miellyttävä käyttää. Eikö tämäkin ole häiritsevää?</p>
<p>Vaikka ääntä käyttöliittymässä saatetaan vastustaa (ja vaikka ääni on käytännössä suunniteltu käyttöliittymistä pois!), ihmiset joka tapauksessa kuuntelevat tietokonettaan saadakseen tietoa prosesseista, joita he eivät voi nähdä. Esimerkkinä tästä on levyaseman hurina tai tulostimen ääni.<sup id="ref-43_6" class="ref"><a href="#note-43" title="(Gaver 1989, 70)">[43]</a></sup><sup id="ref-76_3" class="ref"><a href="#note-76" title="(Walker &amp; Brewster 2000, 2)">[76]</a></sup>. Toisaalta suhtautuminen ääneen on ymmärrettävää: emme voi sulkea korviamme (toisin kuin silmiämme), joten kuuloaistin ainoa suojautumiskeino on epämieluisten äänten suodattaminen ja keskittyminen miellyttävimpiin ääniin<sup id="ref-71_11" class="ref"><a href="#note-71" title="(Schafer 1977, 11)">[71]</a></sup>. On kuitenkin otettava huomioon, että myös epämiellyttävät äänet ovat merkitseviä. Seuraavaksi tarkastellaan äänen funktioita käyttöliittymässä.</p>
</div>
<div id="ch-4_2">
<h4>4.2 Äänen käyttötarkoitus <a title="takaisin sisällysluetteloon" href="#toc-4_2">^</a></h4>
<p>Ääntä on yleensä käytetty elokuvassa ainakin kuvien yhdistämiseen (ylimeno) tai ilmapiirin luomiseen<sup id="ref-33_21" class="ref"><a href="#note-33" title="(Chion 1990, 47)">[33]</a></sup>. Perinteisessä elokuvatutkimuksessa elokuva ilman ääntä pysyy elokuvana, mutta elokuva ilman kuvaa ei ole enää elokuva<sup id="ref-33_22" class="ref"><a href="#note-33" title="(Chion 1990, 143)">[33]</a></sup>. Tämä ajattelumalli kuvaa hyvin visuaalisen informaation ylivaltaa, vaikka kokeellisissa elokuvissa näitä kirjoittamattomia sääntöjä onkin pyritty tietoisesti rikkomaan. Chionin<sup id="ref-33_23" class="ref"><a href="#note-33" title="(Chion 1990, 145--148)">[33]</a></sup> mukaan äänielokuvan alkuaikoina ei ollut teknisesti mahdollista käyttää monia ääniä päällekkäin, koska silloin ne eivät olisi erottuneet toisistaan. Jos käytettiin useita ääniä, yhden piti olla ylitse muiden. Tähän saattoi Chionin mielestä olla myös kulttuurisia syitä: melu ei useimpien ihmisten mielestä ole esteettisesti kiehtovaa.<sup id="ref-33_24" class="ref"><a href="#note-33" title="(Chion 1990, 145--148)">[33]</a></sup>. Melu on määritelty epämieluisaksi, epämusikaaliseksi tai kovaksi ääneksi (vaikka &#8220;epämieluisa ääni&#8221; on subjektiivinen kokemus, se nojaa myös yhteisön tuottamiin sopimuksiin)<sup id="ref-71_12" class="ref"><a href="#note-71" title="(Schafer 1977, 182--183)">[71]</a></sup>.</p>
<p>Schafer<sup id="ref-71_13" class="ref"><a href="#note-71" title="(Schafer (1977, 205)">[71]</a></sup> pitää maailman äänimaisemaa yhtenä suurena sävellyksenä, johon kaikki ihmiset osallistuvat säveltäjinä, esiintyjinä ja kuulijoina. Prosessiin kuuluu eri äänten analysointi ja päättäminen siitä, mitä ääniä haluamme säilyttää ja mitä poistaa. Tällä tavalla voidaan päästä melusta eroon. Vaikka tällainen näkemys on melko naivi, se saattaa olla mahdollista toteuttaa pienemmässä mittakaavassa: käyttöliittymässä suunnittelija voi toimia säveltäjänä, esiintyjänä ja kuuntelijana.</p>
<p>Chion<sup id="ref-33_25" class="ref"><a href="#note-33" title="(Chion 1990, 73)">[33]</a></sup> esittelee mielenkiintoisen viitekehyksen äänen kolmijakoisesta roolista elokuvassa: äänitapahtuma voi olla joko (a) näytöllä (onscreen), (b) näytön ulkopuolella näkymättömissä (offscreen) tai (c) näkymättömissä, mutta ei myöskään missään suhteessa näytöllä oleviin tapahtumiin (nondiegetic, esimerkiksi musiikki). Chion kritisoi itsekin tätä jakoa puutteelliseksi ja lisää<sup id="ref-33_26" class="ref"><a href="#note-33" title="(Chion 1990, 82--83)">[33]</a></sup>, että jos suljemme silmämme tai katsomme muualle, näytön ulkopuoliset äänet muuttuvat näytöllä oleviksi ääniksi. Äänen rooli syntyy siis visuaalisen ja äänellisen yhteistyönä. Chion<sup id="ref-33_27" class="ref"><a href="#note-33" title="(Chion 1990, 75)">[33]</a></sup> lisää tähän kolmijakoon vielä äänitapahtumat, jotka ympäröivät tilaa ilman, että kiinnitetään huomiota niiden tunnistamiseen tai tarpeeseen nähdä niiden lähde. Niiden avulla voitaisiin kuitenkin tunnistaa jokin tila. Chionin näkökulma lähenee tässä kohdin Schaferin<sup id="ref-71_14" class="ref"><a href="#note-71" title="(Schafer 1977)">[71]</a></sup> ja Sauen<sup id="ref-67_0" class="ref"><a href="#note-67" title="(Saue 2000)">[67]</a></sup> näkemyksiä äänimaisemasta. Chionin elokuvateoriat ovat erityisen hyödyllisiä myös käyttöliittymäkontekstissa, koska jako näytöllä ja sen ulkopuolella oleviin äänitapahtumiin viittaa piiloinformaation olemassaoloon.</p>
<p>Äänen funktiona ei ole (pelkästään) viihdyttäminen, vaan piiloinformaation tunnistaminen ja esittäminen käyttäjälle<sup id="ref-45_0" class="ref"><a href="#note-45" title="(Gaver 1993b, 228)">[45]</a></sup><sup id="ref-16_10" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 467)">[16]</a></sup>. Tämä näkemys kiteyttää oleellisen ja pitää sisällään laajan kirjon mahdollisia käyttötarkoituksia. Herefordin ja Winnin mukaan<sup id="ref-51_4" class="ref"><a href="#note-51" title="(Hereford ja Winn 1994, 212--213)">[51]</a></sup> äänellä on käyttöliittymässä kaksi funktiota: (a) ääni kertoo käyttäjälle järjestelmän tilasta kullakin hetkellä hälytysäänillä tai &#8220;tarkkailemalla&#8221; taustalla kunnes käyttäjä vaatii tietoa järjestelmän tilasta ja (b) välittää ohjelmien tuottamaa tietoa. Buxton<sup id="ref-31_0" class="ref"><a href="#note-31" title="(Buxton 1990, 124--127)">[31]</a></sup> taas jakaa äänet käyttöliittymässä kolmeen luokkaan sen mukaan, minkälaista informaatiota ne välittävät:</p>
<ul>
<li>hälytys- ja varoitusäänet</li>
<li>järjestelmän tilasta kertovat äänet</li>
<li>koodatut viestit.</li>
</ul>
<p>Varoitusäänten (yleensä kovia ja korkeita ääniä) tarkoituksena on keskeyttää meneillään oleva tehtävä. Järjestelmän tilasta kertovien äänten tarkoituksena on välittää informaatiota meneillään olevasta tehtävästä tai prosessista. Tällaiset äänet ovat yleensä pitkiä ääniä tai toistuvia kuvioita, jotka häipyvät taka-alalle prosessin päättymisen jälkeen. Näin käyttäjä voi keskittyä päätehtävään (kunnes ääni taas ilmaantuu etualalle ilmoittaen prosessissa tapahtuvasta muutoksesta). Ihminen ei pysy kauaa tietoisena staattisista äänistä, mutta aktivoituu heti, kun äänessä tapahtuu jokin muutos (esimerkiksi jos autolla ajaessa moottorin ääni yhtäkkiä muuttuu). Ihminen pystyy tarkkailemaan useita samanaikaisia ääniä taka-alalla (mikäli äänet ovat riittävän erilaisia), mutta reagoimaan vain yhteen tai kahteen samanaikaisesti. Koodattujen viestien tarkoituksena taas on välittää kvantitatiivista informaatiota. Tällaiset äänet ovat vaihtelevan monimuotoisia, toisin kuin hälytysäänet ja järjestelmän tilasta kertovat äänet.<sup id="ref-31_1" class="ref"><a href="#note-30" title="(Buxton 1990, 124--127)">[30]</a></sup>.</p>
<p>Beaudouin&#8211;Lafon ja Gaver<sup id="ref-11_1" class="ref"><a href="#note-11" title="(Beaudouin--Lafon ja Gaver 1994, 49--50)">[11]</a></sup> vuorostaan jakavat äänen funktiot seuraavasti: ääni (a) antaa palautetta käyttäjän toiminnoista, (b) ilmoittaa järjestelmän toiminnasta ja (c) lisää tietoisuutta muiden käyttäjien toiminnoista. Esimerkkinä kohdasta (a) voidaan mainita Gaverin &#8220;SonicFinder&#8221;<sup id="ref-43_7" class="ref"><a href="#note-43" title="(Gaver 1989)">[43]</a></sup> ja kohdasta (b) Gaverin, Smithin ja O&#8217;Shean &#8220;ARKOLA simulation&#8221;<sup id="ref-47_0" class="ref"><a href="#note-47" title="(Gaver, Smith ja O'Shea 1991)">[47]</a></sup>. Kohtaa (c) ei tässä käsitellä, koska kiinnostuksen kohteena on yksittäinen käyttäjä. Edelliseen kolmijakoon voitaisiin lisätä vielä tieto eri äänitapahtumien sijainnista ja merkityksistä tilassa, mistä päästään tämän tutkimuksen aiheeseen. Toisaalta spatiaalinen ääni ei ole oma kohtansa; pikemminkin se on uutena ulottuvuutena läsnä kaikissa niissä funktioissa, joissa ääni voi käyttöliittymässä toimia.</p>
<p>Käytännön esimerkkinä äänen käytöstä mainittakoon Albersin ja Bergmanin<sup id="ref-2" class="ref"><a href="#note-2" title="(Albers ja Bergman 1995, 318)">[2]</a></sup> laajennus Mosaic-selaimeen nimeltä &#8220;Audible Web&#8221; (prototyyppi), jonka tarkoituksena on äänen avulla (a) antaa informaatiota tiedonsiirron etenemisestä, (b) antaa palautetta käyttäjän toimista sekä (c) antaa sisällöllistä palautetta linkkien koostumuksesta navigoinnin helpottamiseksi (esimerkiksi tiedoston tyyppi, koko ja latausaika). Prototyypissä on tekijöiden mukaan pyritty liittämään ääni huomaamattomasti kokonaisuuteen luonnolliseksi osaksi vuorovaikutusta. Juuri tämä tulisi olla äänen osuus: ei visuaalisuuteen jälkeenpäin liitetty osa, vaan alusta asti mukaan suunniteltu.</p>
<p>Brown ym.<sup id="ref-27_2" class="ref"><a href="#note-27" title="(Brown ym. 1989, 346)">[27]</a></sup> päätyivät tutkimuksessaan siihen, että käyttäjät voivat erottaa äänestä useita samanaikaisia informaatioyksikköjä ja reagoida niihin tarjotun informaation mukaisesti. Tutkimuksesta kävi myös ilmi, että esittämällä informaatiota sekä äänen että grafiikan avulla voidaan näyttöä käyttää useisiin samanaikaisiin tehtäviin. Informaatio voi kuitenkin jäädä käyttöliittymässä piiloon ainakin seuraavista syistä<sup id="ref-24" class="ref"><a href="#note-24" title="(Brewster, Wright &amp; Edwards 1995, 3)">[24]</a></sup>:</p>
<ul>
<li>Informaatio ei ole saatavilla esimerkiksi näytön pienuuden takia.</li>
<li> Informaatio on saatavilla, mutta vaikea saada (esimerkiksi tiedoston koko).</li>
<li>Informaatiota on liikaa (visuaalinen yliannostus).</li>
<li>Käyttäjän katse on suuntautunut väärään paikkaan.</li>
</ul>
<p>Viimeksi mainittu kohta on tärkeä. Kuten kohdassa 2.2 todettiin, tapahtumalla on kaksi kohtaa ajassa: itse tapahtuma ja sen havaitseminen. Näiden välinen ero voi olla suuri, ellei käyttäjä huomaa katsoa oikeaan paikkaan. Jos kaikki tämä piiloon jäävä informaatio saadaan äänen avulla esille, lisääntyy käyttöliittymän tehokkuus ratkaisevasti. Ongelma on näin ollen selvä: minkälaisia ääniä pitäisi käyttää? Brewster<sup id="ref-21_2" class="ref"><a href="#note-21" title="(Brewster 1994)">[21]</a></sup> pyrkii väitöskirjassaan tutkimaan, minkälaisia ääniä pitäisi käyttää käyttöliittymässä, mutta ottaa silti symboliset äänet annettuina ja sivuuttaa ikoniset äänet ilman perusteluja. Tällainen näkökulma on ollut vallitseva 1990-luvun loppupuolella, jolloin symbolisia musiikillisia ääniä on pyritty liittämään käyttöliittymän toimintoihin. 1980-luvun ja 1990-luvun alun ikoniset kokeilut ja akustinen ekologia on jostain syystä jätetty vähemmälle huomiolle. Seuraavassa esitellään näitä tutkimuksia ja pohditaan sitä, miten spatiaalisen äänen avulla voitaisiin tunnistaa ja esittää piilossa olevaa informaatiota.</p>
</div>
<div id="ch-4_3">
<h4>4.3 Ikoniset äänet <a title="takaisin sisällysluetteloon" href="#toc-4_3">^</a></h4>
<p>Gaver<sup id="ref-42_1" class="ref"><a href="#note-42" title="(Gaver 1986, 168)">[42]</a></sup> määrittelee <em>ikoniset äänet</em> (auditory icons) ääniksi, jotka välittävät informaatiota tietystä tapahtumasta. Oleellista ikonisissa äänissä on se, että ne muistuttavat objektiaan<sup id="ref-74_0" class="ref"><a href="#note-74" title="(Tarasti 1990, 29)">[74]</a></sup><sup id="ref-40_2" class="ref"><a href="#note-40" title="(Fiske 2000, 70)">[40]</a></sup>: äänellä on siis suora yhteys vastaavaan äänilähteeseen, jolloin ne ovat ikonisessa suhteessa toisiinsa. Gaverin ajattelussa keskeistä on, että ääni välittää informaatiota äänilähteen ja sen ympäristön ominaisuuksista, ei äänestä itsessään. Hänen mukaansa saamme informaatiota ympäröivästä maailmasta äänen avulla (ks. jokapäiväinen kuunteleminen, <a title="kohta 2.5" href="#ch-2_5">kohta 2.5</a>). Gaverin<sup id="ref-45_1" class="ref"><a href="#note-45" title="(Gaver 1993b, 228)">[45]</a></sup> mukaan liittämällä ikonisiin ääniin parametreja (esimerkiksi koko tai nopeus) voidaan viitata tapahtumien ja objektien kategorioiden lisäksi (visuaalisten ikonien tapaan) myös niiden ulottuvuuksiin. Esimerkiksi tiedoston ollessa iso se myös kuulostaa isolta. Parametrisoitujen ikonisten äänten hyvänä puolena voidaan pitää sitä, että informaatiota saadaan enemmän suoraan havainnoimalla kuin symbolisesti opettelemisen kautta.<sup id="ref-45_2" class="ref"><a href="#note-45" title="(Gaver 1993b, 228)">[45]</a></sup>.</p>
<p>Brownin ym.<sup id="ref-27_3" class="ref"><a href="#note-27" title="(Brown ym. 1989, 340)">[27]</a></sup> mielestä saattaa olla vaikea löytää luonnollista äänellistä vastinetta objektin spatiaaliselle visuaaliselle sijainnille. Näkemys on melko yksioikoinen: edellä on jo osoitettu, että objekti voidaan sijoittaa sellaiseen sijaintiin äänimaisemassa, joka vastaa objektin visuaalista sijaintia. Toisekseen, objektin äänellisen ja kuvallisen esityksen ei välttämättä edes tarvitse olla yhteneväinen. Oleellista on se, mitä spatiaalinen ääni merkitsee.</p>
<p>Mansurin ym.<sup id="ref-62_2" class="ref"><a href="#note-62" title="(Mansur ym. 1985, 117)">[62]</a></sup> mukaan ikonisten äänten avulla voidaan informaatiota välittää nopeammin kuin tekstin tai syntetisoidun puheäänen avulla. Ääni-ikoneita käyttämällä voidaan heidän mukaansa saavuttaa seuraavia hyötyjä:</p>
<ul>
<li>Käyttäjä voi rauhassa keskittyä päätehtävään luottaen siihen, että ääni-ikoni ilmoittaa tärkeästä väliin tulevasta tapahtumasta.</li>
<li>Käyttäjän ei tarvitse katsoa näytölle saadakseen ääni-ikonin välittämän tiedon.</li>
<li>Hyvin suunnitellut ääni-ikonit voivat olla helpommin opittavissa kuin visuaaliset ikonit.</li>
<li>Ääni-ikonien avulla voidaan korvata tekstimuodossa olevat ilmoitukset ja siten keventää visuaalista kuormaa.</li>
<li>Ääntä voidaan käyttää silloin kun näköaistia ei voida käyttää (esim. jos käyttäjä on näkövammainen, käyttäjä ei ole koneen ääressä tai jos käyttäjä on yhteydessä järjestelmään puhelimen välityksellä).<sup id="ref-62_3" class="ref"><a href="#note-62" title="(Mansur ym. 1985, 117)">[62]</a></sup>.</li>
</ul>
<p>Gaverin ym.<sup id="ref-47_1" class="ref"><a href="#note-47" title="(Gaver ym. 1991, 85)">[47]</a></sup> mukaan äänen attribuutit ja haluttu informaatio ovat usein keinotekoisessa suhteessa toisiinsa. Ne voidaan saattaa lähempään viittaussuhteeseen, jos äänitapahtumien attribuutit esittävät käyttöliittymän tapahtumien attribuutteja. Gaver väittää myös, että ikoniset äänet eivät ole niin ärsyttäviä kuin musiikilliset äänet, koska ikonien avulla voidaan täydentää ja laajentaa jo olemassaolevaa ääniympäristöä. Suunniteltaessa ääniä käyttöliittymään on tärkeää, että käytetään ääniä tietyssä funktiossa, ikoni viittaa mahdollisimman tarkasti objektiin (äänilähteeseen) ja että äänet ovat selkeästi eroteltavissa toisistaan. Käyttöliittymän akustinen ekologia tulisi olla kuultavissa sekä kokonaisääniympäristönä että erillisinä äänivirtoina, jotka välittävät informaatiota yksittäisistä objekteista.<sup id="ref-47_2" class="ref"><a href="#note-47" title="(Gaver ym. 1991, 85)">[47]</a></sup>.</p>
<p>Gaver<sup id="ref-42_2" class="ref"><a href="#note-42" title="(Gaver 1986, 168--169)">[42]</a></sup> antaa esimerkin ikonisesta äänestä viestin saapuessa sähköpostijärjestelmään: kirje putoaa kirjelaatikkoon, mistä kuuluu tunnistettava ääni. Jos kirje on iso, kuuluu &#8220;painava&#8221; ääni. Paperimainen ääni ilmaisee, että kyseessä on tekstitiedosto. Ääni tulee vaimeana vasemmalta: kirjelaatikko on siis oltava näytön vasemmalla puolella ja toisen ikkunan takana. Kaiku (suuri tyhjä huone) ilmaisee, että järjestelmä ei ole liian kuormitettu. Äänet siis välittävät informaatiota materiaaleista, jotka ovat toistensa kanssa vuorovaikutuksessa tietyssä sijainnissa tietyssä ympäristössä.<sup id="ref-42_3" class="ref"><a href="#note-42" title="(Gaver 1986, 168--169)">[42]</a></sup>. Gaver<sup id="ref-42_4" class="ref"><a href="#note-42" title="(Gaver 1986, 173)">[42]</a></sup> painottaa kuitenkin, ettei ääni-ikonien tarvitse olla täysin realistisia, riittää että ne esittävät oleellisimmat piirteet äänitapahtumasta.</p>
<p>Erilaiset vuorovaikutukset ääniobjektien välillä välittävät erilaista tietoa materiaaleista: esimerkiksi isku antaa informaatiota objektin koosta, kun taas raapaisu vihjaa enemmän objektin koostumukseen<sup id="ref-42_5" class="ref"><a href="#note-42" title="(Gaver 1986, 173)">[42]</a></sup>. Vanderveer<sup id="ref-75" class="ref"><a href="#note-75" title="(Vanderveer 1979)">[75]</a></sup> toisti 30 erilaista ääntä nauhalta (esimerkiksi käsien taputus tai paperin repiminen) ja pyysi koehenkilöitä tunnistamaan äänet. Vanderveerin tutkimus osoitti, että koehenkilöt tunnistivat äänilähteet sekä tapahtumat jotka aiheuttivat ne, ja turvautuivat kuvaamaan äänen fyysisiä attribuutteja vain mikäli eivät tunnistaneet äänilähdettä.<sup id="ref-43_8" class="ref"><a href="#note-43" title="(Gaver 1989, 72)">[43]</a></sup>. Vanderveerin tutkimus tukee näkemystä, että ihmiset kuuntelevat saadakseen tietoa äänilähteistä, harvemmin ääntä itsessään.</p>
<p>Gaver<sup id="ref-43_9" class="ref"><a href="#note-43" title="(Gaver 1989, 77)">[43]</a></sup> määrittelee käyttöliittymän tapahtumat toiminnoiksi, jotka kohdistuvat kappaleisiin. Kappaleet vuorostaan koostuvat objekteista, joihin kuuluu esimerkiksi tiedostoja, kansioita ja ikkunoita. Valinta, raahaaminen ja avaaminen ovat esimerkkejä toiminnoista.<sup id="ref-43_10" class="ref"><a href="#note-43" title="(Gaver 1989, 77)">[43]</a></sup>. Jokainen kappale-toiminto&#8211;yhdistelmä muodostaa tapahtuman, jota on mahdollista kuvata vastaavilla äänitapahtumilla<sup id="ref-43_11" class="ref"><a href="#note-43" title="(Gaver 1989, 78)">[43]</a></sup>. Vuorovaikutuksen lisäksi voidaan saadaan tietoa objektin ominaisuuksista. Ongelmana tässä on se, miten saada objektiivista tietoa objektin ominaisuuksista. Kuulija vertaa kuulemaansa muihin ääniin: esimerkiksi äänenkorkeudella ei ole absoluuttista arvoa, vaan se on aina käsitettävä suhteessa muiden äänten korkeuksiin. Eräs ratkaisu tähän voisi olla kaikkien käyttöliittymän objektien muodostama kokonaisäänimaisema, jonka sisällä voidaan vertailla eri ääniä toisiinsa eri konteksteissa. Keskeistä on se, voidaanko jokapäiväisiä ääniä liittää luonnollisesti ja merkityksellisesti käyttöliittymän tapahtumiin<sup id="ref-43_12" class="ref"><a href="#note-43" title="(Gaver 1989, 77)">[43]</a></sup>. SonicFinder esittää pääasiassa toisteista informaatiota<sup id="ref-43_13" class="ref"><a href="#note-43" title="(Gaver 1989, 82)">[43]</a></sup>. Joissakin tapauksissa visuaalinen informaatio voidaan kuitenkin korvata kokonaan: napin painalluksesta voidaan antaa palautetta käyttäjälle pelkästään äänen avulla. Samalla tavalla palautetta voidaan antaa tehokkaasti äänen avulla muistakin toiminnoista (visuaalisen palautteen sijaan), jolloin käyttäjä voi keskittyä päätehtävään näkönsä avulla<sup id="ref-23" class="ref"><a href="#note-23" title="(Brewster, Wright, Dix &amp; Edwards 1995, 48)">[23]</a></sup>.</p>
<p>Gaver<sup id="ref-43_14" class="ref"><a href="#note-43" title="(Gaver 1989, 89--90)">[43]</a></sup> ottaa ikonisten äänten kohdalla esiin kaksi ongelmaa: (a) minkälaisia ääniä pitäisi käyttää silloin kun kyseessä on vain tietokonemaailmassa esiintyvä tapahtuma, esimerkiksi virhe kirjoitettaessa levylle tai ikkunan avautuminen (ei avaudu kuten reaalimaailmassa, vaan zoomautuu isommaksi) ja (b) minkälaisia ääniä pitäisi käyttää sellaisissa käyttöliittymän tapahtumissa, joiden reaalimaailman vastineet eivät aiheuta ääntä tai aiheuttavat merkityksetöntä ääntä. Gaver esittää ratkaisuna ensin mainittuun ongelmaan elokuvallisten ääniefektien käyttöä. Elokuvien ääniefektit eivät liity tapahtumiin sattumanvaraisesti, vaan perustuvat kuuntelijoiden kykyyn yleistää tietämystään jokapäiväisistä äänitapahtumista. Näin ollen, vaikka ikkunat eivät SonicFinderissa avaudu, tämä tapahtuma muistuttaa muita jokapäiväisiä ääniä, esim. objektin äkillistä laajentumista. Myös Cohen<sup id="ref-34" class="ref"><a href="#note-34" title="(Cohen 1993, 63--64)">[34]</a></sup> on ehdottanut lajityyppien käyttöä (&#8220;genre sounds&#8221;), jolloin käyttöliittymässä voitaisiin käyttää ääniä tutuista elokuvista tai televisio- ja radio-ohjelmista.</p>
<p>Jälkimmäiseen ongelmaan Gaver ehdottaa lähdemetaforien käyttöä. Esimerkiksi asiakirjaa kopioitaessa reaalimaailman kopiokone ei välitä informaatiota siitä, kuinka paljon kopioitavaa on vielä jäljellä. Tällainen ääni olisi kuitenkin tietokoneen käyttäjälle relevanttia tietoa. Tällöin on keksittävä jokin toinen äänitapahtuma kuvaamaan paremmin prosessin etenemistä, esimerkiksi veden kaatamisen ääni. Tällöin äänitapahtuma on ikonisessa suhteessa lähteeseensä, kun taas ääni-ikoni on metaforisessa suhteessa tapahtumaan.<sup id="ref-43_15" class="ref"><a href="#note-43" title="(Gaver 1989, 89--90)">[43]</a></sup>. Gaverin<sup id="ref-43_16" class="ref"><a href="#note-43" title="(Gaver 1989, 91)">[43]</a></sup> mielestä näillä edellämainitulla kahdella tavalla voidaan ikonisten äänten käyttörajoituksia hälventää. Ääniefektejä voidaan käyttää sellaisiin tapahtumiin, joita ei ole reaalimaailmassa, ja hyvinsuunnitellut efektit ovat silti kausaalisessa suhteessa tapahtumaan. Käyttämällä metaforisia ikonisia ääniä voidaan muodostaa analogioita äänitapahtumien välillä turvautumatta analogioihin tapahtumien ja äänen fysikaalisten attribuuttien välillä.<sup id="ref-43_17" class="ref"><a href="#note-43" title="(Gaver 1989, 91)">[43]</a></sup>.</p>
<p>Spatiaalisesta äänestä Gaver<sup id="ref-43_18" class="ref"><a href="#note-43" title="(Gaver 1989, 92)">[43]</a></sup> toteaa, että ongelmana ei ole niinkään sijainti tilassa, vaan haluttujen objektien ja sijaintien löytäminen tilasta. Tällöin spatiaaliset ääni-ikonit voivat tarjota vihjeitä navigoinnille, tarjoamalla tietoa esimerkiksi äänellisen tilan koosta tai sen rajojen läheisyydestä. Kursori toimii tällöin tavallaan tutkana, joka tarkastelee ympäristöä. Tällainen lähestymistapa tuottaa sellaisia spatiaalisia vihjeitä mallimaailmasta, jotka eivät ole pelkästään visuaalisia.<sup id="ref-43_19" class="ref"><a href="#note-43" title="(Gaver 1989, 92)">[43]</a></sup>. Ikonisia ääniä kritisoidaan usein (ks. esimerkiksi Brewster<sup id="ref-21_3" class="ref"><a href="#note-21" title="(Brewster 1994)">[21]</a></sup>) niiden aiheuttamien rajoitusten vuoksi: tietyillä objekteilla tai tapahtumilla ei ole ikonista vastinetta. Miksei samalla tavalla kritisoida visuaalisia ikoneita, koska eiväthän nekään aina esitä sitä mitä niiden pitäisi? Ärsykkeeseen perustuva suora reaktio on nopeampi kuin symboliin koodatun informaation havaitsemiseen käytetty aika<sup id="ref-48_15" class="ref"><a href="#note-48" title="(Gibson 1966, 91)">[48]</a></sup>. Tämä näkemys vahvistaa oletusta, että käyttöliittymässä tulisi käyttää mieluummin ikonisia kuin symbolisia ääniä, joita käsitellään seuraavaksi.</p>
</div>
<div id="ch-4_4">
<h4>4.4 Symboliset äänet <a title="takaisin sisällysluetteloon" href="#toc-4_4">^</a></h4>
<p><em>Symboliset äänet</em> (earcons) ovat abstrakteja, synteettisiä ääniä, joita voidaan käyttää strukturoidusti äänellisten viestien esittämiseen käyttöliittymässä (koskien objekteja tai niiden vuorovaikutusta)<sup id="ref-17_0" class="ref"><a href="#note-17" title="(Blattner ym. 1989, 13)">[17]</a></sup><sup id="ref-22_1" class="ref"><a href="#note-22" title="(Brewster ym. 1993, 222)">[22]</a></sup>. Tutkijat käyttävät käsitettä vapaasti, viitaten sillä joskus sekä ikonisiin että symbolisiin ääniin. Koska &#8220;earconit&#8221; ovat useimmiten olleet musiikillisia ja synteettisiä ääniä, luokitellaan ne tässä symbolisiksi. Symboli ei muistuta objektiaan (kuten ikoni), vaan merkitys syntyy siitä, mitä ihmiset ovat keskenään sopineet<sup id="ref-74_1" class="ref"><a href="#note-74" title="(Tarasti 1990, 30)">[74]</a></sup><sup id="ref-40_3" class="ref"><a href="#note-40" title="(Fiske 2000, 70)">[40]</a></sup>. Tällöin äänen ja objektin välinen suhde on keinotekoinen. Gaverin<sup id="ref-43_20" class="ref"><a href="#note-43" title="(Gaver 1989, 72)">[43]</a></sup> ja Herefordin ja Winnin<sup id="ref-51_5" class="ref"><a href="#note-51" title="(Hereford ja Winn 1994, 219)">[51]</a></sup> mukaan symboliset äänet eivät ole kovinkaan intuitiivisia, koska ne täytyy opetella ennen käyttöä; musiikillisten äänten liittäminen tietokoneen tapahtumiin on myös useimmiten satunnaista.</p>
<p>Symboliset äänet perustuvat motiiveihin, joita voidaan yhdistellä ja muunnella; niitä voidaan myös periyttää hierarkiassa alempana oleville äänitapahtumille<sup id="ref-17_1" class="ref"><a href="#note-17" title="(Blattner ym. 1989, 14, 19)">[17]</a></sup><sup id="ref-11_2" class="ref"><a href="#note-11" title="(Beaudouin--Lafon &amp; Gaver 1994, 50)">[11]</a></sup>. Symbolisissa äänissä on Blattnerin ym.<sup id="ref-16_11" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 453)">[16]</a></sup> mukaan se hyöty, että äänten ei tarvitse vastata kohdettaan. Tämä johtaa väistämättä siihen, että symboliset äänet täytyy opetella ennen käyttöä. Hälytysäänet ja signaalit ovat esimerkkejä symbolisista äänistä<sup id="ref-17_2" class="ref"><a href="#note-17" title="(Blattner ym. 1989, 14)">[17]</a></sup>. Symbolien yhdistelmät &#8212; esimerkiksi objektin ja vuorovaikutuksen yhdistelmät &#8212; , saattavat olla helpommin toteutettavissa äänellä kuin visuaalisesti, koska ääni on seurausta vähintään kahden objektin vuorovaikutuksesta.</p>
<p>Schafer<sup id="ref-71_15" class="ref"><a href="#note-71" title="(Schafer 1977, 170--178)">[71]</a></sup> luettelee esimerkkejä luonnossa ja elinympäristössämme esiintyvistä symbolista äänistä ja niihin mahdollisesti liitetyistä merkityksistä:</p>
<dl>
<dt><em>vesi:</em></dt>
<dd>puhdistava, uudistava, liikkeessä oleva, uudestisyntyvä, ikuinen, rytminen (esimerkiksi laineet)</dd>
<dt><em>tuuli:</em></dt>
<dd>ailahteleva, suuntaa vaihtava</dd>
<dt><em>soittokellot:</em></dt>
<dd>joko yhteenkerääminen (esimerkiksi kirkonkello) tai poisajaminen (pahojen henkien karkottaminen)</dd>
<dt><em>torvet:</em></dt>
<dd>voimakas, aggressiivinen, heijastavat viranomaisten arvovaltaa ja viittaavat voittoon</dd>
<dt><em>sireenit:</em></dt>
<dd>ahdistus ja hätä.</dd>
</dl>
<p>Tällaisten äänten hyödyntäminen käyttöliittymässä ei ole lainkaan keinotekoista, koska niiden merkitys on opittu jokapäiväisestä elämästä. Seuraavaksi käsitellään metaforia: perustuuhan suuri osa graafisesta käyttöliittymästä juuri niiden käytölle. Miten ääni voidaan liittää luonnolliseksi osaksi käyttöliittymän metaforista työpöytää?</p>
</div>
<div id="ch-4_5">
<h4>4.5 Metaforiset äänet <a title="takaisin sisällysluetteloon" href="#toc-4_5">^</a></h4>
<p>Useimmat käyttäjät eivät tehtävää suorittaessaan ajattele tietokonetta koneena, vaan avaavat ikkunoita ja manipuloivat asiakirjoja<sup id="ref-43_21" class="ref"><a href="#note-43" title="(Gaver 1989, 85)">[43]</a></sup>. Tällöin on kyse <em>metaforista</em>. Metaforassa käytetään hyväksi yhtäläisyyttä ja eroavuutta siirtämällä (assosioimalla) ominaisuuksia todellisuuden yhdeltä tasolta toiselle<sup id="ref-40_4" class="ref"><a href="#note-40" title="(Fiske 2000, 122, 127)">[40]</a></sup>. Tällöin pyritään etsimään yhtäläisyyksiä eri tasojen välillä, mikä vaatii mielikuvitusta ja saattaa joskus synnyttää jopa surrealistisen vaikutelman<sup id="ref-40_5" class="ref"><a href="#note-40" title="(Fiske 2000, 130--131)">[40]</a></sup>.</p>
<p>Laurelin<sup id="ref-61_0" class="ref"><a href="#note-61" title="(Laurel 1991, 128)">[61]</a></sup> mukaan metaforien käyttö perustuu teoriaan, että kun käyttöliittymässä imitoidaan reaalimaailman objekteja, käyttäjät tietävät luonnostaan, miten toimia. Metaforien käyttö aiheuttaa Laurelin mielestä kuitenkin seuraavan ongelman: käyttöliittymän objekteilla ei ole joitakin reaalimaailman objektien fyysisiä ominaisuuksia (esimerkiksi painoa). Tämä johtaa siihen, että käyttöliittymäobjektit ovat reaalimaailman kaltaisia, mutta toisaalta puutteellisia, ja toisaalta täydennettyjä sellaisilla ominaisuuksilla, joita ei reaaliobjekteilla ole. Laurelin mielestä käyttöliittymämetaforat ovatkin <em>vertauksia</em>: vertaus kertoo käyttöliittymäobjektin olevan reaaliobjektin kaltainen, muttei aina sitä, millä tavalla nämä eroavat toisistaan. Metaforat siis toisaalta helpottavat käytön oppimista, mutta toisaalta sisältävät kognitiivisia epäloogisuuksia.<sup id="ref-61_1" class="ref"><a href="#note-61" title="(Laurel 1991, 128--130)">[61]</a></sup>.</p>
<p>Tärkeää äänen käytössä ovat yhdenmukaiset kausaalisuhteet äänen ja muiden modaliteettien välillä: äänen on vastattava suoritettua toimintoa<sup id="ref-61_2" class="ref"><a href="#note-61" title="(Laurel 1991, 160--161)">[61]</a></sup>. Tämä viittaa siis jälleen audiovisuaaliseen sopimukseen ja väliaikaiseen jaksolliseen rakenteeseen.</p>
<p>Walker<sup id="ref-77_0" class="ref"><a href="#note-77" title="(Walker 1987)">[77]</a></sup> tutki kulttuurisen taustan, elinympäristön, iän ja musiikillisen taustan vaikutusta koehenkilöiden kykyyn valita sopiva visuaalinen metafora äänten akustisille parametreille. Tarkoituksena oli siis kuvata kuultua visuaalisen metaforan kautta kvalitatiivisesti. Koehenkilöt valitsivat seuraavat visuaaliset metaforat: taajuus&#8211;vertikaalinen sijainti; amplitudi&#8211;koko; aaltomuoto&#8211;kuvio; kesto&#8211;horisontaalinen pituus<sup id="ref-77_1" class="ref"><a href="#note-77" title="(Walker 1987, 496)">[77]</a></sup>. Tulokset osoittivat, että musiikillinen koulutus vaikutti metaforien valitsemiseen enemmän kuin kulttuuri, ikä  tai ympäristö<sup id="ref-77_2" class="ref"><a href="#note-77" title="(Walker 1987, 497--498)">[77]</a></sup>. Tämä tutkimustulos vahvistaa näkemystä, että mikäli halutaan saavuttaa äänen käytöllä suurin mahdollinen käyttäjäryhmä, musiikillisten (symbolisten) äänten käyttö täytyy harkita tarkkaan. Äänten täytyy ainakin olla riittävän erilaisia.</p>
<p>Spatiaaliset metaforat ovat hyödyllisiä käyttöliittymässä, esimerkiksi jos informaatio järjestellään metaforisen rakennuksen huoneisiin<sup id="ref-80_1" class="ref"><a href="#note-80" title="(Wenzel 1994, 40)">[80]</a></sup>. Useimmissa liikkuvan tietojenkäsittelyn sovelluksissa käytetään edelleen pöytätietokoneeseen liittyviä käsitteitä, kuten näppäimistöä, osoitinlaitteita ja graafisia elementtejä<sup id="ref-68_4" class="ref"><a href="#note-68" title="(Sawhney &amp; Schmandt 1997, 109)">[68]</a></sup>. Graafisissa käyttöliittymissä käytettyä työpöytä-metaforaa ei Brewsterin ym.<sup id="ref-25_1" class="ref"><a href="#note-25" title="(Brewster ym. 1998, 26)">[25]</a></sup> mielestä voida käyttää pienikokoisissa kannettavissa laitteissa näytön pienuuden takia. Myös työpöytä-metafora sisältää epäloogisuuksia, jotka on erikseen opeteltava: esimerkiksi reaalimaailman työpöytä ei sisällä ikkunoita<sup id="ref-51_6" class="ref"><a href="#note-51" title="(Hereford &amp; Winn 1994, 214)">[51]</a></sup>. Samoin, jos ääni muuttuu kovasta hiljaiseen tiedostoa tuhottaessa, se poikkeaa työpöytämetaforasta: asiat työpöydällä eivät tuosta vaan häivy hiljakseen näkyvistä<sup id="ref-43_22" class="ref"><a href="#note-43" title="(Gaver 1989, 87--88)">[43]</a></sup>. Kartta saattaa olla hyvä spatiaalinen metafora, koska karttoja käytetään suuntautumiseen ja navigointiin<sup id="ref-16_12" class="ref"><a href="#note-12" title="(Blattner ym. 1994, 458)">[16]</a></sup>. Koska kartta on ahdettu täyteen visuaalista informaatiota, informaatiota saattaa jäädä piiloon. Jos taas sama informaatio sijoitellaan spatiaaliseen äänimaisemaan, informaation hukkuminen on epätodennäköisempää.</p>
<p>Navigoitaessa keskeistä on löytää haluttu objekti tilasta, jolloin graafisissa käyttöliittymissä usein käytetty puumainen hierarkia ei välttämättä ole kaikista käyttökelpoisin. Spatiaalisen äänen avulla on mahdollista saada aikaan abstrakti, mentaalinen tila &#8212; paikka &#8212; äänellä navigoinnille (yksityinen ääni-informaatioavaruus, kupla!). Tällöin voidaan vapautua näytön asettamista rajoituksista ja ahtaista raameista. Saue<sup id="ref-67_1" class="ref"><a href="#note-67" title="(Saue 2000, 1--4)">[67]</a></sup> esittää mielenkiintoisen metaforan: käyttäjä kävelee polkuja pitkin ja kuuntelee samalla lokaalisti ja globaalisti määriteltyjä äänitapahtumia. Informaatio on sijoiteltu tiettyihin sijainteihin äänimaisemaan, jossa käyttäjä voi kuunnella oman liikkumisensa aiheuttamia ääniä (&#8220;kävely&#8221;), lähiympäristön äänitapahtumia (paikalliset muuttujat), ympäristön tunnistamiseen tarvittavia ääniä (globaalit muuttujat) ja äänitapahtumien manipuloinnista aiheutuvia ääniä (esimerkiksi objektin valinta tai raahaaminen). Äänet ovat suhteessa kuuntelijan sijaintiin kullakin hetkellä, eli äänimaisema muuttuu jatkuvasti. Tämä seikka aiheuttaa kuitenkin ongelmia objektien sijainnin muistamisessa (ks. myös Kobayashi &amp; Schmandt<sup id="ref-59_6" class="ref"><a href="#note-59" title="(Kobayashi &amp; Schmandt 1997)">[59]</a></sup>). Saue esittää tähän kaksi ratkaisua: (a) kohdan merkitseminen visuaalisella merkillä ja (b) polun tekeminen kiinnostavan sijainnin läpi. Jälkimmäinen ratkaisu luo ajallisen jakson pisteitä, joka voi muodostaa mielekkään kokonaisuuden. Tällöin päästään jälleen kuuntelemaan Blyn<sup id="ref-18_3" class="ref"><a href="#note-18" title="(Bly 1982, 374)">[18]</a></sup> mainitsemaa merkityksellistä &#8220;laulua&#8221;.</p>
<p>Sauen ajatukset saattavat pohjautua Howardin ja Ballaksen<sup id="ref-52_7" class="ref"><a href="#note-52" title="(Howard ja Ballas 1980)">[52]</a></sup> ja Warrenin ja Verbruggen<sup id="ref-78_2" class="ref"><a href="#note-78" title="(Warren ja Verbrugge 1984)">[78]</a></sup> artikkeleihin, joissa painotettiin väliaikaisen rakenteen ja syntaksin tärkeää osuutta merkityksen muodostamisessa. Sauen jako paikallisiin ja globaaleihin ääniin on myös mielenkiintoinen: käyttäjä voi kuunnella vain niitä ääniä, jotka on paikallisesti määritelty tietyllä rajatulla alueella kokonaisäänimaisemassa. Tällainen jaottelu vihjaa jakoon tuttuihin ja tuntemattomiin ääniin. Sauen malli pohjautuu jokapäiväiseen kuuntelemiseen, huomion kiinnittymiseen paikallisiin tai globaaleihin ääniin, spatiaalisen äänen mahdollistamaan suuntautumiseen äänen suuntaan sekä äänitapahtuman ominaisuuksien havaitsemiseen<sup id="ref-67_2" class="ref"><a href="#note-67" title="(Saue 2000, 4)">[67]</a></sup>.</p>
<p>Myös Schafer<sup id="ref-71_16" class="ref"><a href="#note-71" title="(Schafer 1977, 212)">[71]</a></sup> puhuu &#8220;äänikävelystä&#8221; (soundwalk). Äänikävely käyttöliittymän kokonaisäänimaisemassa voi muodostaa metaforisen tilakokemuksen, jossa äänet merkitsevät ja kertovat käyttöliittymän tilasta ja toiminnoista. Schafer<sup id="ref-71_17" class="ref"><a href="#note-71" title="(Schafer 1977, 211--212)">[71]</a></sup> puhuu &#8220;turistista&#8221; äänimaisemassa: äänet havaitaan paremmin vieraassa ääniympäristössä. Schaferin ideana on, että kuuntelija luokittelisi kuulemansa äänimaiseman äänet tietoisesti. Turistina oleminen on pelkkä välivaihe (ajattelutapa) havaita ympärillämme olevat äänet tehokkaammin.</p>
<p>Edellä käsiteltyjen ikonien, symbolien ja metaforien rajat eivät ole itsestäänselviä. Oleellista ei ehkä olekaan se, mihin kategoriaan ääni kuuluu. Äänet on paras hahmottaa jatkumona, jonka toisessa päässä ovat esittävät äänet ja toisessa päässä abstraktit äänet<sup id="ref-10" class="ref"><a href="#note-10" title="(Barger 1994, 59)">[10]</a></sup>. Fiske<sup id="ref-40_6" class="ref"><a href="#note-40" title="(Fiske 2000, 79)">[40]</a></sup> korostaa, että myös ikonien ymmärtäminen edellyttää jossain määrin niihin tottumista. Samaa mieltä on Tarasti<sup id="ref-74_2" class="ref"><a href="#note-74" title="(Tarasti 1990, 30)">[74]</a></sup> pohtiessaan, että myös ikonisuus on pohjimmiltaan käsitteellistä. Täysin puhdas ikoni lienee siten mahdottomuus. Tästä seuraa, että myös käyttöliittymän äänet täytyy opetella; täysin intuitiivinen käyttöliittymä saattaa olla käytännössä mahdoton toteuttaa. Seuraavaksi tarkastellaan äänitapahtumien erilaisia luokittelumahdollisuuksia.</p>
</div>
<div id="ch-4_6">
<h4>4.6 Äänitapahtumien luokittelujärjestelmät <a title="takaisin sisällysluetteloon" href="#toc-4_6">^</a></h4>
<p>Jotta äänitapahtumia voitaisiin intuitiivisesti yhdistää käyttöliittymän toimintoihin, täytyy äänet ensin luokitella. Gaver<sup id="ref-46_10" class="ref"><a href="#note-46" title="(Gaver 1993c, 9)">[46]</a></sup> analysoi äänitapahtumia kvalitatiivisesti ja jakaa ne kolmeen kategoriaan: (a) värähteleviin kappaleisiin (esimerkiksi askeleet), (b) nestemäisiin ääniin (esimerkiksi veden lorina tai kappaleen putoaminen veteen) ja (c) aerodynaamisiin tapahtumiin (esimerkiksi tuulen ääni). Gaverin<sup id="ref-46_11" class="ref"><a href="#note-46" title="(Gaver 1993c, 20--21)">[46]</a></sup> tavoitteena on järjestellä jokapäiväisen kuuntelun äänitapahtumat yleiseen ja yksinkertaiseen, kuultavissa olevaan  muotoon. Yksi tapa on järjestää ne kontekstin mukaan (esimerkiksi toimiston äänet). Gaver kuitenkin toteaa, ettei tämä tapa ole riittävä ja esittelee sen sijaan hierarkkisen viitehyksen. Koska äänitapahtuma syntyy materiaalien vuorovaikutuksen tuloksena<sup id="ref-46_12" class="ref"><a href="#note-46" title="(Gaver 1993c, 22)">[46]</a></sup>, eräs mahdollisuus on sijoittaa materiaalit ylemmälle tasolle ja vuorovaikutuksen muodot alemmalle. Gaver<sup id="ref-46_13" class="ref"><a href="#note-46" title="(Gaver 1993c, 26)">[46]</a></sup> kuitenkin toteaa, että esimerkiksi isku saattaa kertoa enemmän sen voimasta kuin materiaalista, tai enemmän materiaalista kuin vuorovaikutuksen muodosta.</p>
<p>Gaverin luokittelu on hyödyllinen, joskaan siinä ei tarkasti oteta kantaa siihen, mitä nämä materiaalit tai vuorovaikutukset merkitsevät käyttöliittymäkontekstissa (huomaa kuitenkin Gaverin &#8220;SonicFinder&#8221;<sup id="ref-43_23" class="ref"><a href="#note-43" title="(Gaver 1989)">[43]</a></sup>, jossa käytettiin menestyksellisesti mm. roskapöntön ääntä). Luokittelussa hylätään kontekstin osuus; elävässä elämässä tämä onkin perusteltua, koska myös toimistossa voi yllättäen kuulua mitä tahansa ääniä. Sen sijaan käyttöliittymässä kontekstin osuus äänten luokittelussa korostuu, koska virtuaalisen äänimaiseman ei täysin tarvitse noudattaa reaalitodellisuutta. Riittää, että tärkeimmät piirteet säilytetään.</p>
<p>Gibson<sup id="ref-48_16" class="ref"><a href="#note-48" title="(Gibson 1966, 79--81)">[48]</a></sup> puolestaan jakaa äänimaiseman seuraavasti: (a) jatkuvat äänet (esimerkiksi vesiputous), (b) epäsäännölliset äänet (esimerkiksi tuuli) sekä (c) äkilliset, odottamattomat äänet (esimerkiksi vieriminen ja hankaaminen). Tämän lisäksi Gibson mainitsee eläinten ja ihmisten tuottamat äänet (puhe, musiikki) sekä teknologisen aikakauden tuottamat koneelliset äänet. Kaikki nämä äänitapahtumat etenevät ajassa, ja useimmilla niistä on alku ja loppu.<sup id="ref-48_17" class="ref"><a href="#note-48" title="(Gibson 1966, 79--81)">[48]</a></sup>. Gibson siis jakaa äänet toisaalta niiden ilmenemistiheyden, toisaalta niiden aiheuttajien mukaan. Tällainen lähestymistapa saattaa olla käyttökelpoisempi kuin Gaverin hierarkkinen luokittelu. Gibsonin luokittelu lähenee pikemminkin Schaferin<sup id="ref-71_18" class="ref"><a href="#note-71" title="(Schafer 1977)">[71]</a></sup> vastaavaa jaottelua: tällöin päästään vihdoin Schaferin edustamaan äänimaisemateoriaan.</p>
<p>Schaferin<sup id="ref-71_19" class="ref"><a href="#note-71" title="(Schafer 1977, 137)">[71]</a></sup> mukaan hankaluutena äänten luokittelussa on se, ettei äänillä ole objektiivisia merkityksiä, vaan kullakin kuulijalla on kulttuuriset näkemyksensä niistä. Schafer<sup id="ref-71_20" class="ref"><a href="#note-71" title="(Schafer 1977, 138--145)">[71]</a></sup> jakaa äänet semanttisesti seuraaviin luokkiin (ja nämä vielä alaluokkiin): (a) luonnolliset äänet (ilma, maa), (b) ihmisen tuottamat äänet (puhe, vaatteiden kahina), (c) kaupunki- ja maaseutuäänimaiseman äänet, (d) mekaaniset äänet (koneet, tuulettimet) ja (e) hiljaisuus. Tällainen lista on merkittävä vain mikäli sitä voidaan soveltaa käyttöliittymään. Sellaisenaan se on tähän tarkoitukseen liian laaja, koska siinä luokitellaan äänet vain niiden aiheuttajien mukaan. Schaferin  mielestä<sup id="ref-71_21" class="ref"><a href="#note-71" title="(Schafer 1977, 111)">[71]</a></sup> 1900-luvun musiikin huomiota herättävin piirre on se, että rajat musiikin ja ympäristön jokapäiväisten äänten välillä ovat hämärtyneet. Sovellettuna käyttöliittymään tämä merkitsee, että nykyajan ihminen on tottunut kaikenlaisten äänten yhdessäoloon. Tämä seikka vaikeuttaa käytettävien äänten valintaa entisestään.</p>
<p>On siis tarpeen miettiä, miten muuten äänet voitaisiin luokitella, jotta niitä voitaisiin soveltaa käyttöliittymään. Edellä äänitapahtumat on jaettu ainakin esittävyyden, abstraktisuuden tai assosiaation periaatteiden mukaan (ikonit, symbolit ja metaforat); materiaalien tai vuorovaikutuksen muodon mukaan; musiikillisten tai ei-musiikillisten äänten mukaan; luonnon tai mekaanisten äänten mukaan. Nämä luokittelujärjestelmät eivät ole täysin vertailukelpoisia keskenään, koska ne sijoittuvat eri tasoille ja osin limittäin. Esimerkiksi luonnon äänet (siis ei-musiikilliset äänet) ovat useimmiten ikonisia, kun taas metaforiset äänet voivat mielikuvituksellisesti yhdistää piirteitä kaikista luokittelutasoista.</p>
<p>On kuitenkin vielä ainakin yksi tapa luokitella ääniä, jota ei käyttöliittymäkontekstissa ole aiemmin käsitelty. Schafer<sup id="ref-71_22" class="ref"><a href="#note-71" title="(Schafer 1977)">[71]</a></sup> kehitti useita käsitteitä, joilla halusi luokitella äänimaisemassa kuuluvia ääniä. Onkin yllättävää, ettei Schaferin käsitteitä ole aiemmin yhdistetty käyttöliittymäkontekstiin. Käsitteet eroavat Schaferin edellä esitetystä jaottelusta: samalla kun ne kuuluvat jokapäiväiseen äänimaisemaamme, ne perustuvat äänten aiheuttajien lisäksi niiden rooleille äänimaisemassa ja ovat siten sovellettavissa spatiaaliseen käyttöliittymään. Lisäksi ne viittaavat tietyn yhteisön olemassaoloon ja tapahtuvat siten aina tietyssä kontekstissa. Äänimaisemaa voidaan Schaferin<sup id="ref-71_23" class="ref"><a href="#note-71" title="(Schafer 1977, 9--10, 43--44)">[71]</a></sup> mukaan kuvata seuraavilla käsitteillä:</p>
<dl>
<dt><em>Perusääni</em></dt>
<dd>on ääni, joka kuuluu yhteisössä jatkuvasti tai tarpeeksi usein muodostaen taustan muille äänille.</dd>
<dt><em>Äänellinen maamerkki</em></dt>
<dd>on yhteisössä ilmenevä ainutlaatuinen ja merkittävä ääni, jota on syytä suojella. Määritelmä viittaa myös tietyn tilan tunnistamiseen  äänen avulla.</dd>
<dt><em>Signaali</em></dt>
<dd>tarkoittaa ääntä, johon kiinnitetään erityisesti huomiota. Esimerkkinä tästä ovat varoitussignaalit.</dd>
<dt><em>Hi-fi</em></dt>
<dd>viittaa ympäristöön, jossa äänet ovat kuultavissa sekoittumatta tai peittymättä toistensa alle.</dd>
<dt><em>Lo-fi</em></dt>
<dd>viittaa ympäristöön, jossa äänet sekoittuvat tai peittyvät toistensa alle. Lo-fi&#8211;ympäristö sai alkunsa teollisen vallankumouksen seurauksena (1700-luvun lopulta lähtien) ja vahvistui entisestään sähköisen vallankumouksen aikana<sup id="ref-71_24" class="ref"><a href="#note-71" title="(Schafer 1977, 71)">[71]</a></sup>. Hiljainen hi-fi&#8211;maailma on siis muuttunut kovaääniseksi lo-fi&#8211;maailmaksi useiden vuosisatojen aikana.</dd>
</dl>
<p>Käsitteet tarjoavat luontevan ympäristön spatiaalisen äänen käytölle. Schafer puhuu yhteisöstä; tässä yhteydessä se voidaan rinnastaa käyttöliittymän muodostamaan akustiseen tilaan. Schaferin<sup id="ref-71_25" class="ref"><a href="#note-71" title="(Schafer 1977, 214)">[71]</a></sup> mukaan <em>akustinen tila</em> tarkoittaa sitä aluetta, jonka sisällä äänet kuuluvat: esimerkiksi ihmisen tuottama akustinen avaruus rajoittuu siihen alueeseen, jossa hänen huutonsa kuuluu. Koneiden avulla tätä akustista aluetta voidaan suurentaa ja myös täyttää ahtaammin.<sup id="ref-71_26" class="ref"><a href="#note-71" title="(Schafer 1977, 214)">[71]</a></sup>. Akustisen tilan äänet merkitsevät jotain vain niissä (virtuaalisissa) ympäristöissä ja konteksteissa, jotka on sidottu käyttöliittymän tapahtumiin. Tällöin siis voidaan yhdistää äänen funktio sen sijaintiin.</p>
<p>Luonnon äänimaisemassa jokaiselle äänitapahtumalle on aikansa; Schafer väittää, että tällainen vuoropuhelu on katoamassa urbaanista maailmasta, jolloin päädytään lo-fi&#8211;äänimaisemaan ja äänten kakofoniaan<sup id="ref-71_27" class="ref"><a href="#note-71" title="(Schafer 1977, 229, 237)">[71]</a></sup>. Schaferin mukaan aiemmissa yhteisöissä suurin osa äänistä oli yksittäisiä ja niillä oli selkeä alku ja loppu, kun taas nykyaikana suurin osa äänistä on jatkuvia<sup id="ref-71_28" class="ref"><a href="#note-71" title="(Schafer 1977, 78)">[71]</a></sup>. Schafer<sup id="ref-71_29" class="ref"><a href="#note-71" title="(Schafer 1977, 88--90)">[71]</a></sup> toteaa myös, että aiemmin kaikki äänet olivat alkuperäisiä, eli ne tapahtuivat tiettynä aikana tietyssä paikassa vain kerran. Sähköisenä aikakautena on mahdollista erottaa ääni äänilähteestään ja siten sen alkuperäisestä kontekstistaan. Tällöin on mahdollista simuloida mitä tahansa ääniympäristöä ja tehdä siitä kannettava, mukana kulkeva kokonaisuus<sup id="ref-71_30" class="ref"><a href="#note-71" title="(Schafer 1977, 91)">[71]</a></sup>.</p>
<p>Schaferin ajatuksista saa dramaattisen vaikutelman, että ihmiset pakenevat ulkomaailman modernia lo-fi&#8211;ääniympäristöä koteihinsa löytääkseen sieltä rauhallisemman hi-fi&#8211;äänimaiseman; samalla tavalla käyttöliittymässä voitaisiin järjestää ihanteellinen keinotodellisuus (yksityinen kupla), jossa kaikki äänet kuuluvat ja ovat merkityksiltään yksiselitteisiä, koska ne on otettu päivittäisestä ympäristöstä ja vain järjestetty paremmin. Koska reaalitodellisuudessa äänimaisemaa saattaa olla mahdotonta muuttaa kovinkaan paljon paremmaksi, käyttöliittymän virtuaalitodellisuus voi tarjota tähän toisen mahdollisuuden. Schafer<sup id="ref-71_31" class="ref"><a href="#note-71" title="(Schafer 1977, 217--219)">[71]</a></sup> pohtii myös, että äänet sisätilassa saattavat merkitä yksityisyyttä, kun taas kaikuisat äänet saattavat merkitä jatkuvuutta tai auktoriteettia. Juuri tällaiset merkitykset ovat tärkeitä &#8212; ja toistaiseksi vähemmän käytettyjä &#8212; käyttöliittymässä. Ne myös viittaavat suoraan spatiaaliseen ääneen. Näiden löydösten perusteella päädytään seuraavassa luvussa kokoamaan yhteen tutkimuksen tulokset.</p>
</div>
<div id="ch-5">
<h3>5. Keskustelua <a title="takaisin sisällysluetteloon" href="#toc-5">^</a></h3>
<p>Luvussa esitellään keskeisimmät tulokset, joita sitten tarkastellaan alussa asetettujen tutkimusongelmien valossa ja aiempiin tutkimuksiin suhteuttaen.</p>
</div>
<div id="ch-5_1">
<h4>5.1 Tulokset <a title="takaisin sisällysluetteloon" href="#toc-5_1">^</a></h4>
<p>Tutkimus on perustunut olettamukseen kuulohavaintojärjestelmän kaksijakoisesta funktiosta: aktiivisesta äänen suunnan havaitsemisesta sekä äänilähteen tunnistamisesta. Tällä perusteella äänen suunnan tuottama merkityssisältö on pyritty yhdistämään käyttöliittymän toimintoihin ja objekteihin piilossa olevan informaation paljastamiseksi. Vaikka sijainti ei olekaan ainoa tekijä äänten erottelun ja ryhmittelyn kannalta, se on valittu käsiteltäväksi juuri sen tarjoaman merkityssisällön vuoksi. Äänivirta mentaalisena kokemuksena voidaan rinnastaa visuaalisen objektin kokemiseen, koska yksittäisestä äänilähteestä peräisin olevat äänet tulevat yleensä yhdestä sijainnista äänellisestä avaruudesta. Muistin aiheuttamien rajoitusten vuoksi käsiteltäväksi on rajattu paikallaan pysyvä ääni.</p>
<p>Kuulo- ja näköaistin vertailu paljasti niiden perimmäiset &#8212; joskin tässä yksinkertaistetut &#8212; erot, samoin kuin kummankin vahvimmat puolet. Koska kuuloaistimme avulla saamme tietoa taustalla tapahtuvista prosesseista, voimme päättää, mitkä osat ympäristöstämme tuodaan näköaistin alueelle. Tästä seuraa, että spatiaalinen ääni auttaa löytämään näytöltä visuaalisen objektin nopeammin, kun kohde on näkökentän ulkopuolella tai muuten piilossa esimerkiksi toisen ikkunan takana (tai ei mahdu pienikokoiselle näytölle). Suuntautumisen lisäksi olennainen ero näkö- ja kuuloaistin välillä on ajallisuus: ääni perustuu vaihteluihin ajassa ja viittaa siten yleensä tilan tarkkailuun tai muutokseen. Kuulo- ja näköaistin eroista johtuen &#8212; ja siten toisiaan täydentäen &#8212; kokemus syntyy äänellisen ja visuaalisen informaation yhteistyönä.</p>
<p>Synteettisen spatialisoinnin toteutuksessa olennaisimmiksi ongelmiksi osoittautuivat peilikuvaäänet, paikantamisvirheet ja tietokoneen suorituskyvyn ylittävä datamäärä (vimeksimainitun ongelman osalta tilanne tosin edistyy koko ajan tekniikan myötä). Vaihe- ja voimakkuuserot korvien välillä, korvalehden ja -käytävän vaikutus sekä pään aiheuttama äänen vaimeneminen ovat tärkeimmät tekijät, jotka muuntavat äänen spektriä muodostaen siirtofunktion, jonka perusteella ääni paikannetaan. Paikantamisvirheet näyttävät keskittyvän siirtofunktion ympärille. Näitä paikantamisvirheitä voidaan tosin huomattavasti vähentää, jos äänen toistossa käytetään kuulokkeita.</p>
<p>Paikantaminen on monimutkainen prosessi, jonka kattava selvittäminen tässä yhteydessä ei ole ollut mahdollista. Tästä syystä tutkimuksen psykoakustista osuutta on väistämättä jouduttu yksinkertaistamaan kuitenkin siten, että keskeisimmät seikat on käsitelty. Toteutukseen liittyvät ongelmat ovat kuitenkin voitettavissa; tästä ovat osoituksena lukuisat spatiaalista ääntä hyödyntävät sovellukset (lähinnä kuitenkin laboratorio-olosuhteissa, ei kaupallisessa käytössä).</p>
<p>Spatiaalisia ääniä käytettäessä on erityisen tärkeää, että erilliset peräkkäiset äänitapahtumat noudattavat väliaikaista jaksollista rakennetta. Peräkkäisten äänitapahtumien on kielen tavoin perustuttava syntaksiin; syntaksi muodostuu niistä mahdollisista väliaikaisista suhteista, joista jakso äänitapahtumia voi keskenään muodostaa järkevän kokonaisuuden. Järkevä kokonaisuus syntyy reaalitodellisuudessa äänilähteiden sanelemassa järjestyksessä ja kestää äänilähteiden ominaisuuksista riippuvan ajan. Tätä seikkaa voidaan hyödyntää jakamalla käyttöliittymän toiminnot äänitapahtumien jaksoiksi: jakso koostuu toiminnoista, jotka käyttäjä tekee suorittaakseen jonkin tehtävän.</p>
<p>Ensimmäisen tutkimusongelman mukaisesti pyrittiin selvittämään, miten spatiaalista ääntä voitaisiin käyttää grafiikan kanssa tehtävän suorituksessa ja piilossa olevien objektien tai tapahtumien esittämisessä. Tulosten mukaan spatiaalinen ääni tarjoaa uuden ulottuvuuden niihin funktioihin, joissa ääni voi käyttöliittymässä toimia. Kun äänen tarkoitus on esimerkiksi antaa palautetta käyttäjän toiminnasta, miksi tyytyä monauraaliseen tai stereoääneen? Spatiaalisen äänen käyttöä puolustavat seuraavat seikat:</p>
<ul>
<li>Toteutus on teknisesti mahdollinen.</li>
<li>Jokapäiväinen äänimaisemamme on spatiaalinen.</li>
<li>Spatiaalinen ääni osoittaa, minne katsoa.</li>
<li>Spatiaalinen ääni voi tarjota informaatiota akustisen tilan ominaisuuksista ja objektien sijainnista.</li>
<li>Informaatiota voidaan järjestellä 360 asteen alueelle, jolloin visuaalisen informaation määrä vähenee.</li>
</ul>
<p>Lisäksi, jokapäiväiset spatiaaliset äänet voivat välittää hienovaraisempaa informaatiota äänitapahtumasta tai vuorovaikutuksen muodosta kuin perinteisten musiikillisten instrumenttien tuottamat äänet (joita käyttöliittymässä on perinteisesti käytetty monauraalisesti tai stereona). Jäljelle jää siten vain sopivan luokittelujärjestelmän valitseminen: tällöin voidaan saada selville, minkälaisia ääniä kannattaisi käyttää missäkin käyttöliittymän tapahtumassa. Tämä on kaikkea muuta kuin helppo tehtävä.</p>
<p>Tutkimuksessa on tarkasteltu useita erilaisia &#8212; sekä hierarkkisia että kontekstipohjaisia &#8212; äänitapahtumien luokittelujärjestelmiä. Niiden vastakkainasettelun perusteella käyttökelpoisimmaksi osoittautui Schaferin (1977) esittämä luokittelu: äänitapahtumien jako perusääniin, äänellisiin maamerkkeihin ja signaaleihin viittaa tietyssä kontekstissa olemassaolevaan akustiseen tilaan. Tällainen jaottelu tarjoaa siten yhden mahdollisen vastauksen tutkimusongelmaan, pitäen sisällään sekä äänen roolin &#8212; merkityksen &#8212; että spatiaalisuuden käyttöliittymässä. Näköaistin osuus tässä on se, että käyttäjä voi kääntää katseensa objektiin (tai reagoida muulla tavoin) ainoastaan silloin, kun siihen todella on tarvetta. Näin näköaisti vapautuu sen hetkiseen tärkeään tehtävään, eikä kuormitu turhalla informaatiolla. Spatiaalinen ääni voi ilmaista tämän tarpeen äänen sijainnin ja merkityksen &#8212; esimerkiksi kiireellisyyden (signaali) tai äänellisen maamerkin &#8212; avulla; merkitykset kun on opittu jokapäiväisestä elämästä. Tällöin voidaan saavuttaa intuitiivinen kuvallisen ja äänellisen informaation yhdistelmä; seikka jota on hyödynnetty peleissä jo vuosikausia. Spatiaalisen äänen muodostamassa kannettavassa &#8220;kuplassa&#8221; informaatiota voidaan järjestellä laajemmalle alueelle kuin visuaalista informaatiota.</p>
<p>On kuitenkin otettava huomioon, että moderni jokapäiväinen äänimaisema voi sisältää myös musiikillisia ääniä: ero on äänten kokemisessa. Oleellista on se, että äänet ja äänilähteet ovat mahdollisimman ikonisessa suhteessa toisiinsa, jolloin niiden opettelemiseen kuluu vähemmän aikaa. Oli kyseessä sitten musiikilliset tai jokapäiväiset äänet, niiden avulla voidaan esimerkiksi tunnistaa jokin metaforinen akustinen tila &#8212; kyseessä on tällöin äänellinen maamerkki. Kontekstin merkitys objektien tunnistamisessa ja merkityksenannossa korostuu etenkin silloin, kun eri fysikaaliset tapahtumat aiheuttavat samankaltaisia ääniä. Aina ei kuitenkaan ole välttämätöntä objektiivisesti tunnistaa äänilähdettä: riittää, että se on reaaliobjektin kaltainen. Käyttöliittymän virtuaalitodellisuudessa voidaan korostaa ja liioitella sellaisia piirteitä, jotka tekevät ääniobjektin merkityksestä yksiselitteisen käyttöliittymäkontekstissa.</p>
<p>Seuraavaksi esitellään toisen tutkimusongelman mahdollista ratkaisua. Tavoitteena oli selvittää, voidaanko käyttöliittymän ulkopuolisia spatiaalisia ääniä hyödyntää piiloinformaation esittämisessä. &#8220;Ulkopuolisilla&#8221; äänillä tarkoitettiin sellaisia ääniä, jotta eivät suoraan liity käyttöliittymän toimintoihin. Yhtenä ratkaisuna voidaan pitää elokuvallisten ääniefektien käyttöä. Tälle voidaan esittää kaksi perustelua: ensinnäkin, ihmisten voidaan olettaa kykenevän yleistää tietämystään jokapäiväisistä äänitapahtumista. Tällöin riittää se, että äänitapahtumat muistuttavat jokapäiväisiä ääniä: kyse on siten metaforisesta assosiaation periaatteesta. Toiseksi: voidaan olettaa, että tietyt äänet ovat tuttuja elokuvista tai televisio- ja radio-ohjelmista. Tällöin käyttöliittymässäkin voitaisiin päästä lähemmäksi tietokonepelien maailmaa &#8212; sitä maailmaa, jossa elokuvat ovat oleskelleet jo useiden kymmenien vuosien ajan. Tästä kuitenkin seuraa, että käytön opettelemiselle täytyy varata hieman enemmän aikaa.</p>
<p>Edellä mainittu &#8220;ulkopuolinen&#8221; ääni voi viitata myös toiseen merkitykseen: nimittäin näytön ulkopuolella, näkymättömissä olevan objektin aiheuttamaan ääneen. Tällä on kaksi seurausta: näytön ulkopuolinen ääni viittaa (a) piilossa olevan informaation olemassaoloon sekä (b) audiovisuaaliseen sopimukseen, koska sulkiessamme silmämme &#8212; tai katsoessamme muualle &#8212; näytön ulkopuoliset äänet muuttuvat näytöllä oleviksi ääniksi. Tämä on yksi osoitus siitä, että elokuvallisella äänellä ja siihen liittyvillä teorioilla on paljon tarjottavana myös käyttöliittymälle. Seuraavassa kohdassa analysoidaan tuloksia tarkemmin suhteessa aiempiin tutkimuksiin.</p>
</div>
<div id="ch-5_2">
<h4>5.2 Johtopäätökset <a title="takaisin sisällysluetteloon" href="#toc-5_2">^</a></h4>
<p>Tutkimus osoittaa, että käyttöliittymässä on mahdollista muodostaa metaforinen akustinen tila, jossa käyttäjä kuuntelee ikonisia spatiaalisia ääniä ja reagoi niihin niiden sisältämän informaatiosisällön mukaisesti. Spatiaalisten jokapäiväisten äänten avulla voidaan paljastaa informaatiota, joka muutoin jäisi visuaalisesti piiloon. Tutkimuksen kontribuutiona voidaan pitää sitä, että siinä on koottu erillisiä tutkimustuloksia pyrkien yhdistämään sitä tietämystä, joka muutoin jäisi insinöörien, musiikkitieteen, kognitiotieteen tai viestintätieteen tutkijoiden erityisalaksi. Aiemmassa tutkimuskirjallisuudessa on ollut silmiinpistävää se, että niissä on keskitytty toisaalta joko symbolisten äänten käyttäjätestaukseen ilman taustalla olevaa teoriaa tai teoreettiseen pohdiskeluun äänen roolista visuaalisen kuorman keventämisessä ilman empiiristä testausta. Asioita ei ole kyetty luontevasti yhdistämään.</p>
<p>Tässä tutkimuksessa ei ole muodostettu varsinaista omaa uutta teoriaa tai mallia; pikemminkin kyse on uudesta näkökulmasta ja asioiden luovasta yhdistämisestä. Olennaisimpana kontribuutiona voidaan pitää akustisen ekologian ja sen sisältämien spatiaalisten äänimaisemakäsitteiden &#8212; samoin kuin elokuvallisten ääniefektien &#8212; yhdistämistä käyttöliittymäkontekstiin. Tällaiset kytkennät ovat erityisen hyödyllisiä, koska ne ovat sovellettavissa laajalti eri järjestelmiin ja laitteisiin. Tekniikka tätä varten on ollut valmiina jo vuosia. TAULUKOSSA 2 on vielä koottu yhteen tutkimuksen tärkeimmät tulokset.</p>
<p>Toisaalta tutkimuksen varjopuolena taas on aiheen laajuus ja abstrakti luonne, jolloin on ollut vaikea välttää liiallista yksinkertaistamista ja yleistämistä. Tulokset kuitenkin osoittavat, että ääniä todella voidaan käyttää laajan käyttäjäryhmän hyväksi; tärkeintä on, ettei musiikillisen koulutuksen puute muodostu erottavaksi tekijäksi. Mahdollisimman laaja käyttäjäryhmä tulisi tietenkin olla tavoitteena, jolloin on perusteltua käyttää sellaisia jokapäiväisiä ääniä, joihin useimmat ovat tottuneet. Tutkimuksessa ei ole esitetty kovinkaan konkreettisia esimerkkejä (muutamia sovelluksia lukuunottamatta): tämä on perusteltua siksi, että alalta puuttuu kokonaisuuden kattava teoria. Juuri tästä syystä tutkimusmenetelmäksi on valittu käsitteellinen synteesi. Aihetta olisi voitu käsitellä myös kaupallisen nykytekniikan näkökulmasta, jolloin saavutettu hyöty olisi ehkä ollut selvemmin osoitettavissa. Näin ei kuitenkaan haluttu tehdä: inhimillisen näkökulman merkitystä ei voi liikaa painottaa. Tekniikan on aina taivuttava ihmisen hyväksi, eikä se saa rajoittaa toteutusta.</p>
<table id="table-2" summary="Tutkimuksen keskeisimmät tulokset">
<caption>TAULUKKO 2. Tutkimuksen tulokset <a title="takaisin sisällysluetteloon" href="#toc-table_2">^</a></caption>
<colgroup>
<col class="problemCol" />
<col class="resultCol" /></colgroup>
<thead>
<tr>
<th scope="col">Ongelma</th>
<th scope="col">Tulokset</th>
</tr>
</thead>
<tbody>
<tr class="odd">
<td>1. Spatiaalinen ääni piiloinformaation välittäjänä</td>
<td>
<ul>
<li>Äänitapahtumien on noudatettava väliaikaista jaksollista rakennetta.</li>
<li>Toteutus on teknisesti mahdollinen.</li>
<li>Spatiaalinen ääni osoittaa, minne katsoa.</li>
<li>Informaatiota voidaan järjestellä 360 asteen alueelle, jolloin visuaalisen informaation määrä vähenee.</li>
<li>Käyttöliittymän äänet voidaan luokitella spatiaalisiin perusääniin, äänellisiin maamerkkeihin ja signaaleihin, jolloin saadaan vihjeitä tietyn akustisen tilan ominaisuuksista ja objektien sijainneista tietyssä kontekstissa.</li>
</ul>
</td>
</tr>
<tr>
<td>2. Käyttöliittymän ulkopuolinen spatiaalinen ääni</td>
<td>
<ul>
<li>Elokuvallisten ääniefektien käyttö.</li>
</ul>
</td>
</tr>
</tbody>
</table>
<p>Vaikka tässä tutkimuksessa esitetyt tulokset saattavat kirjoitushetkellä olla utopiaa kaupallisissa sovelluksissa, se ei kuitenkaan saa olla tekosyy äänen täydelliselle hylkäämiselle käyttöliittymistä. Tutkimuksen päätteeksi yhteenvedossa käydään lyhyesti läpi tutkimuksen rakenne ja tulokset sekä  pohditaan jatkotutkimusaiheita.</p>
</div>
<div id="ch-6">
<h3>6. Yhteenveto <a title="takaisin sisällysluetteloon" href="#toc-6">^</a></h3>
<p>Tutkimuksessa on tarkasteltu spatiaalista ääntä graafisen käyttöliittymän laajentajana. Ääntä ei ole toistaiseksi hyödynnetty käyttöliittymässä riittävästi. Tarkoituksena on ollut selvittää, (a) miten spatiaalista ääntä voitaisiin käyttää tehokkaasti grafiikan kanssa piiloinformaation välittämisessä ja tehtävän suorituksessa ja (b) miten sellaista ääntä, jolla ei ole selvää vastinetta käyttöliittymässä, voitaisiin käyttää piilossa olevan informaation esittämisessä. Käsitteellis-teoreettisen analyysin avulla on pyritty sijoittamaan keskeiset käsitteet laajempaan viitekehykseen. Tutkimukseen on sisällytetty myös äänten luokittelujärjestelmien vertailu.</p>
<p>Tutkimus on jakaantunut kahteen pääteemaan: (a) spatiaalisen äänen tuottamaan merkityssisältöön ja (b) ympäristön spatiaalisten äänten hyödyntämiseen ja liittämiseen käyttöliittymän objekteihin ja toimintoihin. Taustaolettamuksena on ollut, että kuuloaistin funktiona on äänen suunnan havaitseminen ja äänilähteen tunnistaminen. Tutkimuksessa on vertailtu ensin kuulo- ja näköaistia, määritelty äänen paikantamiseen vaikuttavat seikat, esitetty sitten synteettisen spatialisoinnin yleisperiaate ja toteutukseen liittyvät ongelmat. Keskeisimpiä ongelmia toteutuksessa ovat peilikuvaäänet, paikantamisvirheet ja tietokoneen suorituskyvyn ylittävä datamäärä. Paikantamisvirheet aiheutuvat epätarkasti mitatusta siirtofunktiosta. Psykoakustisen tarkastelun jälkeen ääntä on tarkasteltu käyttöliittymäkontekstissa semioottisessa viitekehyksessä.</p>
<p>Tulokset osoittavat, että spatiaalinen ääni voi tuoda uuden ulottuvuuden niihin funktioihin, joissa ääni voi käyttöliittymässä toimia. Tällöin spatiaaliset ääni-ikonit voivat tarjota vihjeitä navigoinnille, tarjoamalla tietoa esimerkiksi akustisen tilan koosta tai äänellisestä maamerkistä, joka viittaa tiettyyn kontekstiin. Sen lisäksi, että spatiaalinen ääni osoittaa minne katsoa, se voi välittää hienovaraista informaatiota prosessin kulusta, akustisen tilan ominaisuuksista tai tapahtuman kiireellisyydestä äänen sijainnin ja kategorian avulla. Tärkeää äänen käytössä ovat audiovisuaalisen sopimuksen ja väliaikaisen jaksollisen rakenteen huomioon ottaminen. Tutkimuksen perusteella on selvää, että mikäli ääniä halutaan menestyksellisesti liittää käyttöliittymän toimintoihin, on otettava huomioon jokapäiväinen kuunteleminen, spatiaalisen äänen mahdollistama suuntautuminen äänen suuntaan sekä äänitapahtuman ominaisuuksien havaitseminen.</p>
<p>Teoreettisen tarkastelun jälkeen on otettava konkreettisempi näkökulma. Jatkossa on tärkeää empiirisesti tutkia sitä, miten tämän tutkimuksen perusteella spatiaalisia ympäristön ääniä voitaisiin &#8212; käytännön tasolla &#8212; kytkeä käyttöliittymän tapahtumiin. Jatkotutkimusaiheita on runsaasti psykoakustiikan, käytännön sovellusten ja akustisen ekologian piirissä. Näistä akustinen ekologia tarjonnee suurimmat haasteet ja hyödyt, koska akustisen ympäristömme äänten käyttäminen käyttöliittymässä voi johtaa intuitiiviseen lopputulokseen.</p>
<p>Erityisesti liikkuvan tietojenkäsittelyn yleistymisen ja laitteiden näyttöjen pienentymisen seurauksena osa visuaalisesta informaatiosta on korvattava äänen avulla. Tällöin spatiaalinen ääni tarjoaa 360 asteen ulottuvuuden informaation esittämiseen. Äänen käyttö käyttöliittymissä tulee melko varmasti lisääntymään tulevaisuudessa huimasti. Toiveena tietenkin on, että spatiaalisen äänimaailman kehitys ja hyväksikäyttö voi murtaa näköaistin ylivallan ja saattaa virtuaalitodellisuuden lähemmäksi todellisuutta &#8212; audiovisuaalisen sopimuksen mukaisesti.</p>
</div>
<div id="refs">
<h3>Lähteet <a title="takaisin sisällysluetteloon" href="#toc-refs">^</a></h3>
<ol>
<li id="note-1"><a href="#ref-1" title="">^</a> Ackerman, M. S., Starr, B., Hindus, D. &amp; Mainwaring, S. D. 1997. Hanging on the &#8216;wire: a field study of an audio-only media space. ACM Transactions on Computer-Human Interaction, 4(1), 39&#8211;66.</li>
<li id="note-2"><a href="#ref-2" title="">^</a> Albers, M. C., Bergman, E. 1995. The audible web: auditory enhancements for Mosaic. Teoksessa Conference companion on Human factors in computing systems, Denver, CO, USA, May 7&#8211;11, 1995, New York: ACM Press, 318&#8211;319.</li>
<li id="note-3"><a href="#ref-3" title="">^</a> Alten, S. R. 1999. Audio in media. 5. painos. USA: Wadsworth publishing company.</li>
<li id="note-4">^ <a href="#ref-4_0" title=""><sup>a</sup></a> <a href="#ref-4_1" title=""><sup>b</sup></a> <a href="#ref-4_2" title=""><sup>c</sup></a> <a href="#ref-4_3" title=""><sup>d</sup></a> Anderson, J. R. 1980/2000. Cognitive psychology and its implications. 5. painos. New York: Worth Publishers.</li>
<li id="note-5"><a href="#ref-5" title="">^</a> Arons, B. 1992. A Review of the cocktail party effect. Journal of the American Voice I/O Society, 12 (July 1992), 35&#8211;50.</li>
<li id="note-6">^ <a href="#ref-6_0" title=""><sup>a</sup></a> <a href="#ref-6_1" title=""><sup>b</sup></a> <a href="#ref-6_2" title=""><sup>c</sup></a>  Ballas, J. A. 1993. Common factors in the identification of an assortment of brief everyday sounds. Journal of Experimental Psychology: Human Perception and Performance, 19(2), 250&#8211;267.</li>
<li id="note-7"><a href="#ref-7" title="">^</a> Ballas, J. A. 1994. Delivery of information through sound. Teoksessa G. Kramer (toim.) Auditory Display: Sonification, Audification and Auditory Interfaces, Reading, MA, USA: Addison&#8211;Wesley Publishing Company, 79&#8211;94.</li>
<li id="note-8">^ <a href="#ref-8_0" title=""><sup>a</sup></a> <a href="#ref-8_1" title=""><sup>b</sup></a> <a href="#ref-8_2" title=""><sup>c</sup></a> <a href="#ref-8_3" title=""><sup>d</sup></a> Ballas, J. A. &amp; Howard, J. A., Jr. 1987. Interpreting the language of environmental sounds. Environment and Behavior, 19(1), 91&#8211;114.</li>
<li id="note-9"><a href="#ref-9" title="">^</a> Ballas, J. A. &amp; Mullins, R. T. 1991. Effects of context on the identification of everyday sounds. Human Performance, 4(3), 199&#8211;219.</li>
<li  id="note-10"><a href="#ref-10" title="">^</a> Barger, R. 1994. Pattern and reference in auditory display. Teoksessa G. Kramer (toim.) Auditory Display: Sonification, Audification and Auditory interfaces, Reading, MA, USA: Addison&#8211;Wesley Publishing Company, 151&#8211;165.</li>
<li id="note-11">^ <a href="#ref-11_0" title=""><sup>a</sup></a> <a href="#ref-11_1" title=""><sup>b</sup></a> Beaudouin&#8211;Lafon, M., Gaver, W. 1994. ENO: Synthesizing structured sound spaces. Teoksessa Proceedings of the Seventh Annual Symposium on User Interface Software and Technology, Marina del Rey, CA, USA, Nov. 2&#8211;4, 1994, New York: ACM Press, 49&#8211;57.</li>
<li id="note-12">^ <a href="#ref-12_0" title=""><sup>a</sup></a> <a href="#ref-12_1" title=""><sup>b</sup></a> <a href="#ref-12_2" title=""><sup>c</sup></a> <a href="#ref-12_3" title=""><sup>d</sup></a> <a href="#ref-12_4" title=""><sup>e</sup></a> <a href="#ref-12_5" title=""><sup>f</sup></a> <a href="#ref-12_6" title=""><sup>g</sup></a> <a href="#ref-12_7" title=""><sup>h</sup></a> <a href="#ref-12_8" title=""><sup>i</sup></a> Begault, D. R. 1991. Challenges to the successful implementation of 3-D sound. Journal of the Audio Engineering Society, 39(11), 864&#8211;870.</li>
<li id="note-13">^ <a href="#ref-13_0" title=""><sup>a</sup></a> <a href="#ref-13_1" title=""><sup>b</sup></a> <a href="#ref-13_2" title=""><sup>c</sup></a> <a href="#ref-13_3" title=""><sup>d</sup></a> Begault, D. R. 1994. 3-D sound for virtual reality and multimedia. Cambridge MA: Academic Press.</li>
<li id="note-14"><a href="#ref-14" title="">^</a> Begault, D. R. 1999. Auditory and non-auditory factors that potentially influence virtual acoustic imagery. Teoksessa Proceedings of the Audio Engineering Society 16th international conference on spatial sound reproduction, Rovaniemi, Finland, April 10&#8211;12, 1999, 13&#8211;26.</li>
<li id="note-15"><a href="#ref-15" title="">^</a> Blattner, M. M., Greenberg, R. M. &amp; Kamegai, M. 1992. Listening to turbulence: an example of scientific audiolization. Teoksessa M. Blattner &amp; R. Dannenberg (toim.) Multimedia Interface Design, New York: ACM Press, 87&#8211;102.</li>
<li id="note-16">^ <a href="#ref-16_0" title=""><sup>a</sup></a> <a href="#ref-16_1" title=""><sup>b</sup></a> <a href="#ref-16_2" title=""><sup>c</sup></a> <a href="#ref-16_3" title=""><sup>d</sup></a> <a href="#ref-16_4" title=""><sup>e</sup></a> <a href="#ref-16_5" title=""><sup>f</sup></a> <a href="#ref-16_6" title=""><sup>g</sup></a> <a href="#ref-16_7" title=""><sup>h</sup></a> <a href="#ref-16_8" title=""><sup>i</sup></a> <a href="#ref-16_9" title=""><sup>j</sup></a> <a href="#ref-16_10" title=""><sup>k</sup></a> <a href="#ref-16_11" title=""><sup>l</sup></a> <a href="#ref-16_12" title=""><sup>m</sup></a> Blattner, M. M., Papp III, A. L. &amp; Glinert, E. P. 1994. Sonic enhancements of two-dimensional graphic displays. Teoksessa G. Kramer (toim.) Auditory Display: Sonification, Audification, and Auditory Interfaces, Reading, MA, USA: Addison Wesley Publishing Company, 447&#8211;470.</li>
<li id="note-17">^ <a href="#ref-17_0" title=""><sup>a</sup></a> <a href="#ref-17_1" title=""><sup>b</sup></a> Blattner, M. M. &amp; Sumikawa, D. A. &amp; Greenberg, R. M. 1989. Earcons and icons: Their structure and common design principles. Human-Computer Interaction 4(1), 11&#8211;44.</li>
<li id="note-18">^ <a href="#ref-18_0" title=""><sup>a</sup></a> <a href="#ref-18_1" title=""><sup>b</sup></a> <a href="#ref-18_2" title=""><sup>c</sup></a> Bly, S. 1982. Presenting information in sound.  Teoksessa Proceedings on Human Factors in Computer Systems, Gaithersburg, Maryland, USA, 1982, New York: ACM Press, 371&#8211;375.</li>
<li id="note-19">^ <a href="#ref-19_0" title=""><sup>a</sup></a> <a href="#ref-19_1" title=""><sup>b</sup></a> <a href="#ref-19_2" title=""><sup>c</sup></a> Bregman, A. S. &amp; Campbell, J. 1971. Primary auditory stream segregation and perception of order in rapid sequences of tones. Journal of Experimental Psychology, 89(2), 244&#8211;249.</li>
<li id="note-20"><a href="#ref-20" title="">^</a> Brewster, S. A. 1991. Providing a model for the use of sound in user interfaces. (Tech. Rep. No. YCS169). University of York, Department of Computer Science, 1&#8211;54.</li>
<li id="note-21">^ <a href="#ref-21_0" title=""><sup>a</sup></a> <a href="#ref-21_1" title=""><sup>b</sup></a> <a href="#ref-21_2" title=""><sup>c</sup></a> <a href="#ref-21_3" title=""><sup>d</sup></a> Brewster, S. A. 1994. Providing a structured method for integrating non-speech audio into human-computer interfaces. University of York, UK. Väitöskirja.</li>
<li id="note-22">^ <a href="#ref-22_0" title=""><sup>a</sup></a> <a href="#ref-22_1" title=""><sup>b</sup></a> Brewster, S. A., Wright, P. C. &amp; Edwards, A. D. N. 1993. An evaluation of earcons for use in auditory human-computer interfaces. Teoksessa Proceedings of the Conference on Human Factors in Computing Systems, Amsterdam, The Netherlands, April 1993, Boston: Addison&#8211;Wesley Longman Publishing Company, 222&#8211;227.</li>
<li id="note-23"><a href="#ref-23" title="">^</a> Brewster, S. A., Wright, P. C., Dix, A. J. &amp; Edwards, A. D. N. 1995. The sonic enhancement of graphical buttons. Teoksessa K. Nordby, P. Helmersen, D. Gilmore, &amp; S. Arnesen (toim.) Proceedings of the IFIP International Conference on Human-Computer Interaction, Lillehammer, Norway, June 25&#8211;29, 1995, London: Chapman &amp; Hall, 43&#8211;48.</li>
<li id="note-24"><a href="#ref-24" title="">^</a> Brewster, S. A., Wright, P. C &amp; Edwards, A. D. N. 1995. The application of a method for integrating non-speech audio into human-computer interfaces. (Tech. Rep. No. YCS253). University of York, Department of Computer Science, 1&#8211;19.</li>
<li id="note-25">^ <a href="#ref-25_0" title=""><sup>a</sup></a> <a href="#ref-25_1" title=""><sup>b</sup></a> Brewster, S.A., Leplatre, G. &amp; Crease, M.G. 1998. Using non-speech sounds in mobile computing devices. Teoksessa C. Johnson (toim.) Proceedings of the First Workshop on Human Computer Interaction with Mobile Devices, Glasgow, UK, Department of Computing Science, University of Glasgow, May 21&#8211;23, 1998, 26&#8211;29.</li>
<li id="note-26"><a href="#ref-26" title="">^</a> Broadbent, D. E. 1958. Perception and communication. New York: Pergamon.</li>
<li id="note-27">^ <a href="#ref-27_0" title=""><sup>a</sup></a> <a href="#ref-27_1" title=""><sup>b</sup></a> <a href="#ref-27_2" title=""><sup>c</sup></a> <a href="#ref-27_3" title=""><sup>d</sup></a> Brown, M. L., Newsome, S. L. &amp; Glinert, E. P. 1989. An experiment into the use of auditory cues to reduce visual workload. Teoksessa Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, Austin, TX, USA, April 30&#8211;May 4, 1989, New York: ACM Press, 339&#8211;346.</li>
<li id="note-28">^ <a href="#ref-28_0" title=""><sup>a</sup></a> <a href="#ref-28_1" title=""><sup>b</sup></a> Burgess, D. A. 1992a. Real-time audio spatialization with inexpensive hardware. Teoksessa Proceedings of the Third International Conference on Signal Processing Applications and Technology, Boston, MA, USA, Nov 2&#8211;5, 1992.</li>
<li id="note-29">^ <a href="#ref-29_0" title=""><sup>a</sup></a> <a href="#ref-29_1" title=""><sup>b</sup></a> <a href="#ref-29_2" title=""><sup>c</sup></a> <a href="#ref-29_3" title=""><sup>d</sup></a> <a href="#ref-29_4" title=""><sup>e</sup></a> <a href="#ref-29_5" title=""><sup>f</sup></a> <a href="#ref-29_6" title=""><sup>g</sup></a> <a href="#ref-29_7" title=""><sup>h</sup></a> <a href="#ref-29_8" title=""><sup>i</sup></a> <a href="#ref-29_9" title=""><sup>j</sup></a> <a href="#ref-29_10" title=""><sup>k</sup></a> <a href="#ref-29_11" title=""><sup>l</sup></a> <a href="#ref-29_12" title=""><sup>m</sup></a> <a href="#ref-29_13" title=""><sup>n</sup></a> <a href="#ref-29_14" title=""><sup>o</sup></a> <a href="#ref-29_15" title=""><sup>p</sup></a> Burgess, D. A. 1992b. Techniques for low cost spatial audio. Teoksessa Proceedings of the fifth annual ACM symposium on user interface software and technology, Monteray, CA, USA, Nov. 15&#8211;18, 1992, New York: ACM Press, 53&#8211;59.</li>
<li id="note-30"><a href="#ref-30" title="">^</a> Buxton, W. 1989. Introduction to this special issue on nonspeech audio. Human-Computer Interaction, 4(1), 1&#8211;9.</li>
<li id="note-31">^ <a href="#ref-31_0" title=""><sup>a</sup></a> <a href="#ref-31_1" title=""><sup>b</sup></a> Buxton, W. 1990. Using our ears: an introduction to the use of nonspeech audio cues. Teoksessa E. J. Farrell (toim.) Extracting Meaning from Complex Data: Processing, Display, Interaction, Vol. 1259, 124&#8211;127.</li>
<li id="note-32"><a href="#ref-32" title="">^</a> Carter, R. C. 1982. Visual search with color. Journal of Experimental Psychology: Human Perception and Performance, 8(1), 127&#8211;136.</li>
<li id="note-33">^ <a href="#ref-33_0" title=""><sup>a</sup></a> <a href="#ref-33_1" title=""><sup>b</sup></a> <a href="#ref-33_2" title=""><sup>c</sup></a> <a href="#ref-33_3" title=""><sup>d</sup></a> <a href="#ref-33_4" title=""><sup>e</sup></a> <a href="#ref-33_5" title=""><sup>f</sup></a> <a href="#ref-33_6" title=""><sup>g</sup></a> <a href="#ref-33_7" title=""><sup>h</sup></a> <a href="#ref-33_8" title=""><sup>i</sup></a> <a href="#ref-33_9" title=""><sup>j</sup></a> <a href="#ref-33_10" title=""><sup>k</sup></a> <a href="#ref-33_11" title=""><sup>l</sup></a> <a href="#ref-33_12" title=""><sup>m</sup></a> <a href="#ref-33_13" title=""><sup>n</sup></a> <a href="#ref-33_14" title=""><sup>o</sup></a> <a href="#ref-33_15" title=""><sup>p</sup></a> <a href="#ref-33_16" title=""><sup>q</sup></a> <a href="#ref-33_17" title=""><sup>r</sup></a> <a href="#ref-33_18" title=""><sup>s</sup></a> <a href="#ref-33_19" title=""><sup>t</sup></a> <a href="#ref-33_20" title=""><sup>u</sup></a> <a href="#ref-33_21" title=""><sup>v</sup></a> <a href="#ref-33_22" title=""><sup>w</sup></a> <a href="#ref-33_23" title=""><sup>x</sup></a> <a href="#ref-33_24" title=""><sup>y</sup></a> <a href="#ref-33_25" title=""><sup>z</sup></a> <a href="#ref-33_26" title=""><sup>1</sup></a> <a href="#ref-33_27" title=""><sup>2</sup></a> Chion, Michel. 1990. Audio-vision: sound on screen. New York: Columbia University Press.</li>
<li id="note-34"><a href="#ref-34" title="">^</a> Cohen, J. 1993. &#8220;Kirk here&#8221;: Using genre sounds to monitor background activity. Teoksessa S. Ashlund, K. Mullet, A. Henderson, E. Hollnagel, &amp; T. White (toim.) Proceedings of the Conference on Human Factors in Computing Systems, Amsterdam, The Netherlands, Apr. 24&#8211;29, 1993, New York: ACM Press, 63&#8211;64.</li>
<li id="note-35">^ <a href="#ref-35_0" title=""><sup>a</sup></a> <a href="#ref-35_1" title=""><sup>b</sup></a> Cohen, J. 1994. Monitoring background activities. Teoksessa G. Kramer (toim.) Auditory Display: Sonification, Audification and Auditory Interfaces, Reading, MA, USA: Addison&#8211;Wesley Publishing Company, 499&#8211;531.</li>
<li id="note-36"><a href="#ref-36" title="">^</a> Dannenberg, R. &amp; Blattner, M. 1992. Introduction: the trend toward multimedia interfaces. Teoksessa M. Blattner &amp; R. Dannenberg (toim.) Multimedia Interface Design, New York: ACM Press, xvii&#8211;xxv.</li>
<li id="note-37">^ <a href="#ref-37_0" title=""><sup>a</sup></a> <a href="#ref-37_1" title=""><sup>b</sup></a> Deutsch, D. 1980. The processing of structured and unstructured tonal sequences. Perception and psychophysics, 28(5), 381&#8211;389.</li>
<li id="note-38">^ <a href="#ref-38_0" title=""><sup>a</sup></a> <a href="#ref-38_1" title=""><sup>b</sup></a> Edwards, A. D. N. 1988. The design of auditory interfaces for visually disabled users. Teoksessa Proceedings of the Conference on Human Factors and Computing Systems, Washington D.C., USA, May 1988, New York: ACM Press, 83&#8211;88.</li>
<li id="note-39"><a href="#ref-39" title="">^</a> Fernström, M. &amp; Bannon, L. Multimedia browsing. 1997. Position paper for the CHI&#8217;97, Workshop on Navigation on Electronic Worlds, Atlanta, GA, USA, March 23&#8211;24, 1997, 1&#8211;10.</li>
<li id="note-40">^ <a href="#ref-40_0" title=""><sup>a</sup></a> <a href="#ref-40_1" title=""><sup>b</sup></a> <a href="#ref-40_2" title=""><sup>c</sup></a> <a href="#ref-40_3" title=""><sup>d</sup></a> <a href="#ref-40_4" title=""><sup>e</sup></a> <a href="#ref-40_5" title=""><sup>f</sup></a> <a href="#ref-40_6" title=""><sup>g</sup></a> Fiske, J. 2000. Merkkien kieli: johdatus viestinnän tutkimiseen. Suomeksi toimittaneet V. Pietilä, R. Suikkanen &amp; T. Uusitupa. 6. painos. Jyväskylä: Gummerus Kirjapaino Oy.</li>
<li id="note-41">^ <a href="#ref-41_0" title=""><sup>a</sup></a> <a href="#ref-41_1" title=""><sup>b</sup></a> <a href="#ref-41_2" title=""><sup>c</sup></a> <a href="#ref-41_3" title=""><sup>d</sup></a> <a href="#ref-41_4" title=""><sup>e</sup></a> <a href="#ref-41_5" title=""><sup>f</sup></a> Fitch, W. T. &amp; Kramer, G. 1994. Sonifying the body electric: superiority of an auditory over a visual display in a complex, multivariate system. Teoksessa G. Kramer (toim.) Auditory Display: Sonification, Audification, and Auditory Interfaces, Reading, MA, USA: Addison&#8211;Wesley Publishing Company, 307&#8211;326.</li>
<li id="note-42">^ <a href="#ref-42_0" title=""><sup>a</sup></a> <a href="#ref-42_1" title=""><sup>b</sup></a> <a href="#ref-42_2" title=""><sup>c</sup></a> <a href="#ref-42_3" title=""><sup>d</sup></a> <a href="#ref-42_4" title=""><sup>e</sup></a> <a href="#ref-42_5" title=""><sup>f</sup></a> Gaver, W.W. 1986. Auditory icons: Using sound in computer interfaces. Human-Computer Interaction, 2(1), 167&#8211;177.</li>
<li id="note-43">^ <a href="#ref-43_0" title=""><sup>a</sup></a> <a href="#ref-43_1" title=""><sup>b</sup></a> <a href="#ref-43_2" title=""><sup>c</sup></a> <a href="#ref-43_3" title=""><sup>d</sup></a> <a href="#ref-43_4" title=""><sup>e</sup></a> <a href="#ref-43_5" title=""><sup>f</sup></a> <a href="#ref-43_6" title=""><sup>g</sup></a> <a href="#ref-43_7" title=""><sup>h</sup></a> <a href="#ref-43_8" title=""><sup>i</sup></a> <a href="#ref-43_9" title=""><sup>j</sup></a> <a href="#ref-43_10" title=""><sup>k</sup></a> <a href="#ref-43_11" title=""><sup>l</sup></a> <a href="#ref-43_12" title=""><sup>m</sup></a> <a href="#ref-43_13" title=""><sup>n</sup></a> <a href="#ref-43_14" title=""><sup>o</sup></a> <a href="#ref-43_15" title=""><sup>p</sup></a> <a href="#ref-43_16" title=""><sup>q</sup></a> <a href="#ref-43_17" title=""><sup>r</sup></a> <a href="#ref-43_18" title=""><sup>s</sup></a> <a href="#ref-43_19" title=""><sup>t</sup></a> <a href="#ref-43_20" title=""><sup>u</sup></a> <a href="#ref-43_21" title=""><sup>v</sup></a> <a href="#ref-43_22" title=""><sup>w</sup></a> <a href="#ref-43_23" title=""><sup>x</sup></a> Gaver, W.W. 1989. The Sonicfinder: an interface that uses auditory icons. Human-Computer Interaction, 4(1), 67&#8211;94.</li>
<li id="note-44">^ <a href="#ref-44_0" title=""><sup>a</sup></a> <a href="#ref-44_1" title=""><sup>b</sup></a> Gaver, W.W. 1993a. How do we hear in the world?: explorations in ecological acoustics. Ecological Psychology 5(4), 285&#8211;313.</li>
<li id="note-45">^ <a href="#ref-45_0" title=""><sup>a</sup></a> <a href="#ref-45_1" title=""><sup>b</sup></a> Gaver, W. W. 1993b. Synthesizing auditory icons. Teoksessa Proceedings of INTERCHI&#8217;93 Conference on Human Factors in Computing Systems, Amsterdam, The Netherlands, Apr. 24&#8211;29, 1993, Reading, MA, USA: ACM Press/Addison&#8211;Wesley, 24&#8211;29.</li>
<li id="note-46">^ <a href="#ref-46_0" title=""><sup>a</sup></a> <a href="#ref-46_1" title=""><sup>b</sup></a> <a href="#ref-46_2" title=""><sup>c</sup></a> <a href="#ref-46_3" title=""><sup>d</sup></a> <a href="#ref-46_4" title=""><sup>e</sup></a> <a href="#ref-46_5" title=""><sup>f</sup></a> <a href="#ref-46_6" title=""><sup>g</sup></a> <a href="#ref-46_7" title=""><sup>h</sup></a> <a href="#ref-46_8" title=""><sup>i</sup></a> <a href="#ref-46_9" title=""><sup>j</sup></a> <a href="#ref-46_10" title=""><sup>k</sup></a> <a href="#ref-46_11" title=""><sup>l</sup></a> <a href="#ref-46_12" title=""><sup>m</sup></a> <a href="#ref-46_13" title=""><sup>n</sup></a> Gaver, W. W. 1993c. What in the world do we hear? An ecological approach to auditory source perception. Ecological Psychology 5(1), 1&#8211;29.</li>
<li id="note-47">^ <a href="#ref-47_0" title=""><sup>a</sup></a>  <a href="#ref-47_1" title=""><sup>b</sup></a> Gaver, W. W., Smith, R. B. &amp; O&#8217;Shea T. 1991. Effective sounds in complex systems: the ARKOLA simulation. Teoksessa Proceedings of the Conference on Human Factors in Computer Systems, New Orleans, Louisiana, USA, April 28&#8211;May 2, 1991, Reading, MA, USA: ACM Press/Addison&#8211;Wesley, 85&#8211;90.</li>
<li id="note-48">^ <a href="#ref-48_0" title=""><sup>a</sup></a> <a href="#ref-48_1" title=""><sup>b</sup></a> <a href="#ref-48_2" title=""><sup>c</sup></a> <a href="#ref-48_3" title=""><sup>d</sup></a> <a href="#ref-48_4" title=""><sup>e</sup></a> <a href="#ref-48_5" title=""><sup>f</sup></a> <a href="#ref-48_6" title=""><sup>g</sup></a> <a href="#ref-48_7" title=""><sup>h</sup></a> <a href="#ref-48_8" title=""><sup>i</sup></a> <a href="#ref-48_9" title=""><sup>j</sup></a> <a href="#ref-48_10" title=""><sup>k</sup></a> <a href="#ref-48_11" title=""><sup>l</sup></a> <a href="#ref-48_12" title=""><sup>m</sup></a> <a href="#ref-48_13" title=""><sup>n</sup></a> <a href="#ref-48_14" title=""><sup>o</sup></a> <a href="#ref-48_15" title=""><sup>p</sup></a> <a href="#ref-48_16" title=""><sup>q</sup></a> <a href="#ref-48_17" title=""><sup>r</sup></a> Gibson, J. J. 1966. The senses considered as perceptual systems. Boston: Houghton Mifflin.</li>
<li id="note-49">^ <a href="#ref-49_0" title=""><sup>a</sup></a> <a href="#ref-49_1" title=""><sup>b</sup></a> <a href="#ref-49_2" title=""><sup>c</sup></a> <a href="#ref-49_3" title=""><sup>d</sup></a> <a href="#ref-49_4" title=""><sup>e</sup></a> <a href="#ref-49_5" title=""><sup>f</sup></a> <a href="#ref-49_6" title=""><sup>g</sup></a> <a href="#ref-49_7" title=""><sup>h</sup></a> Goldstein, E. B. 1999. Sensation &amp; perception. 5. painos. USA: Brooks/Cole Publishing Company.</li>
<li id="note-50">^ <a href="#ref-50_0" title=""><sup>a</sup></a> <a href="#ref-50_1" title=""><sup>b</sup></a> <a href="#ref-50_2" title=""><sup>c</sup></a> <a href="#ref-50_3" title=""><sup>d</sup></a> <a href="#ref-50_4" title=""><sup>e</sup></a> <a href="#ref-50_5" title=""><sup>f</sup></a> Goose, S. &amp; Möller, C. 1999. A 3D audio only interactive Web browser: using spatialization to convey hypermedia document structure. Teoksessa Proceedings of the seventh ACM International Conference on Multimedia, Orlando, Florida, USA, Oct. 30&#8211;Nov. 5, 1999, New York: ACM Press, 363&#8211;371.</li>
<li id="note-51">^ <a href="#ref-51_0" title=""><sup>a</sup></a> <a href="#ref-51_1" title=""><sup>b</sup></a> <a href="#ref-51_2" title=""><sup>c</sup></a> <a href="#ref-51_3" title=""><sup>d</sup></a> <a href="#ref-51_4" title=""><sup>e</sup></a> <a href="#ref-51_5" title=""><sup>f</sup></a> <a href="#ref-51_6" title=""><sup>g</sup></a> Hereford, J &amp; Winn, W. 1994. Non-speech sound in human-computer interaction: A review and design guidelines. Journal of Educational Computing Research, 11(3), 211&#8211;233.</li>
<li id="note-52">^  <a href="#ref-52_0" title=""><sup>a</sup></a> <a href="#ref-52_1" title=""><sup>b</sup></a> <a href="#ref-52_2" title=""><sup>c</sup></a> <a href="#ref-52_3" title=""><sup>d</sup></a> <a href="#ref-52_4" title=""><sup>e</sup></a> <a href="#ref-52_5" title=""><sup>f</sup></a> <a href="#ref-52_6" title=""><sup>g</sup></a> <a href="#ref-52_7" title=""><sup>h</sup></a> Howard, J. H., Jr., &amp; Ballas, J. A. 1980. Syntactic and semantic factors in the classification of nonspeech transient patterns. Perception &amp; Psychophysics, 28(5), 431&#8211;439.</li>
<li id="note-53">^ <a href="#ref-53_0" title=""><sup>a</sup></a> <a href="#ref-53_1" title=""><sup>b</sup></a> <a href="#ref-53_2" title=""><sup>c</sup></a> <a href="#ref-53_3" title=""><sup>d</sup></a> <a href="#ref-53_4" title=""><sup>e</sup></a>  Huopaniemi, J. 1999. Virtual acoustics and 3-D sound in multimedia signal processing. Helsingin Teknillinen korkeakoulu. Sähkö- ja tietoliikennetekniikan osasto, akustiikan ja äänenkäsittelytekniikan laboratorio. Väitöskirja.</li>
<li id="note-54">^ <a href="#ref-54_0" title=""><sup>a</sup></a> <a href="#ref-54_1" title=""><sup>b</sup></a> <a href="#ref-54_2" title=""><sup>c</sup></a> <a href="#ref-54_3" title=""><sup>d</sup></a> <a href="#ref-54_4" title=""><sup>e</sup></a> <a href="#ref-54_5" title=""><sup>f</sup></a> <a href="#ref-54_6" title=""><sup>g</sup></a> <a href="#ref-54_7" title=""><sup>h</sup></a> <a href="#ref-54_8" title=""><sup>i</sup></a> <a href="#ref-54_9" title=""><sup>j</sup></a> <a href="#ref-54_10" title=""><sup>k</sup></a> <a href="#ref-54_11" title=""><sup>l</sup></a> <a href="#ref-54_12" title=""><sup>m</sup></a> <a href="#ref-54_13" title=""><sup>n</sup></a> <a href="#ref-54_14" title=""><sup>o</sup></a> <a href="#ref-54_15" title=""><sup>p</sup></a> <a href="#ref-54_16" title=""><sup>q</sup></a> <a href="#ref-54_17" title=""><sup>r</sup></a> <a href="#ref-54_18" title=""><sup>s</sup></a> Jauhiainen, T. 1995. Kuulo ja viestintä. Helsinki: Yliopistopaino.</li>
<li id="note-55">^ <a href="#ref-55_0" title=""><sup>a</sup></a> <a href="#ref-55_1" title=""><sup>b</sup></a> Jones, D. 1993. Objects, streams, and threads of auditory attention. Teoksessa A. Baddeley &amp; L. Weiskrantz (toim.) Attention: Selection, awareness, and control. A tribute to Donald Broadbent, Oxford: Clarendon Press, 87&#8211;104.</li>
<li id="note-56">^ <a href="#ref-56_0" title=""><sup>a</sup></a> <a href="#ref-56_1" title=""><sup>b</sup></a> <a href="#ref-56_2" title=""><sup>c</sup></a> <a href="#ref-56_3" title=""><sup>d</sup></a> <a href="#ref-56_4" title=""><sup>e</sup></a> Jot, J.&#8211;M. 1997. Real-time spatial processing of sounds for music, multimedia and interactive human-computer interfaces. Multimedia Systems, 7(1), 55&#8211;69.</li>
<li id="note-57">^ <a href="#ref-57_0" title=""><sup>a</sup></a> <a href="#ref-57_1" title=""><sup>b</sup></a> <a href="#ref-57_2" title=""><sup>c</sup></a> <a href="#ref-57_3" title=""><sup>d</sup></a> <a href="#ref-57_4" title=""><sup>e</sup></a> <a href="#ref-57_5" title=""><sup>f</sup></a> <a href="#ref-57_6" title=""><sup>g</sup></a> <a href="#ref-57_7" title=""><sup>h</sup></a> <a href="#ref-57_8" title=""><sup>i</sup></a> <a href="#ref-57_9" title=""><sup>j</sup></a> <a href="#ref-57_10" title=""><sup>k</sup></a> <a href="#ref-57_11" title=""><sup>l</sup></a> <a href="#ref-57_12" title=""><sup>m</sup></a> <a href="#ref-57_13" title=""><sup>n</sup></a> <a href="#ref-57_14" title=""><sup>o</sup></a> Kendall, G. 1995. A 3-D sound primer: directional hearing and stereo reproduction. [viitattu 13.5.2002]. Saatavilla www-muodossa <a href="http://www.nwu.edu/musicschool/classes/3D/pages/sndPrmGK.html">http://www.nwu.edu/musicschool/classes/3D/pages/sndPrmGK.html</a>.</li>
<li id="note-58">^  <a href="#ref-58_0" title=""><sup>a</sup></a> <a href="#ref-58_1" title=""><sup>b</sup></a> <a href="#ref-58_2" title=""><sup>c</sup></a> <a href="#ref-58_3" title=""><sup>d</sup></a> <a href="#ref-58_4" title=""><sup>e</sup></a> Kleiner, M., Dalenbeck, B.&#8211;I. &amp; Svensson, P. 1993. Auralization &#8212; an overview. Journal of the Audio Engineering Society, 41(11), 861&#8211;875.</li>
<li id="note-59">^ <a href="#ref-59_0" title=""><sup>a</sup></a> <a href="#ref-59_1" title=""><sup>b</sup></a> <a href="#ref-59_2" title=""><sup>c</sup></a> <a href="#ref-59_3" title=""><sup>d</sup></a> <a href="#ref-59_4" title=""><sup>e</sup></a> <a href="#ref-59_5" title=""><sup>f</sup></a> <a href="#ref-59_6" title=""><sup>g</sup></a> Kobayashi, M., Schmandt, C. 1997. Dynamic Soundscape: mapping time to space for audio browsing. Teoksessa Conference Proceedings on Human factors in computing systems, Atlanta, GA, USA, March 22&#8211;27, 1997, New York: ACM Press, 194&#8211;201.</li>
<li id="note-60">^ <a href="#ref-60_0" title=""><sup>a</sup></a> <a href="#ref-60_1" title=""><sup>b</sup></a> <a href="#ref-60_2" title=""><sup>c</sup></a> <a href="#ref-60_3" title=""><sup>d</sup></a> <a href="#ref-60_4" title=""><sup>e</sup></a> <a href="#ref-60_5" title=""><sup>f</sup></a> <a href="#ref-60_6" title=""><sup>g</sup></a> <a href="#ref-60_7" title=""><sup>h</sup></a> <a href="#ref-60_8" title=""><sup>i</sup></a> Kramer, G. 1994. An introduction to auditory display. Teoksessa G. Kramer (toim.) Auditory Display: Sonification, Audification and Auditory interfaces, Reading, MA, USA: Addison&#8211;Wesley Publishing Company, 1&#8211;77.</li>
<li id="note-61">^ <a href="#ref-61_0" title=""><sup>a</sup></a> <a href="#ref-61_1" title=""><sup>b</sup></a> <a href="#ref-61_2" title=""><sup>c</sup></a> Laurel, B. 1991. Computers as theatre. Reading, MA, USA: Addison&#8211;Wesley Publishing Company.</li>
<li id="note-62">^ <a href="#ref-62_0" title=""><sup>a</sup></a> <a href="#ref-62_1" title=""><sup>b</sup></a> <a href="#ref-62_2" title=""><sup>c</sup></a> <a href="#ref-62_3" title=""><sup>d</sup></a> Mansur, D. L., Bly S. A., Frysinger, S. P , Lunney, D, Metzrich, J. J. &amp; Morrison, R. C. 1985. Communication with sound (panel session). Teoksessa W. Buxton (toim.) Proceedings on Human Factors in Computing Systems, San Francisco, CA, USA, 1985, New York: ACM Press, 115&#8211;119.</li>
<li id="note-63">^ <a href="#ref-63_0" title=""><sup>a</sup></a> <a href="#ref-63_1" title=""><sup>b</sup></a> <a href="#ref-63_2" title=""><sup>c</sup></a> <a href="#ref-63_3" title=""><sup>d</sup></a> <a href="#ref-63_4" title=""><sup>e</sup></a> <a href="#ref-63_5" title=""><sup>f</sup></a> McGrath, D. 1995. High resolution simulation of acoustic environments. [viitattu 13.5.2002]. Saatavilla www-muodossa <a href="http://www.headwize.com/tech/lake1_tech.htm">http://www.headwize.com/tech/lake1_tech.htm</a>.</li>
<li id="note-64"><a href="#ref-64" title="">^</a> Mereu, S. W. &amp; Kazman, R. 1996. Audio enhanced 3D interfaces for visually impaired users. Teoksessa Proceedings on Human Factors in Computing Systems, Vancouver, British Columbia, Canada, Apr. 13&#8211;18, 1996, New York: ACM Press, 72&#8211;78.</li>
<li id="note-65"><a href="#ref-65" title="">^</a> Mynatt, E. D. &amp; Weber, G. 1994. Nonvisual presentation of graphical user interfaces: contrasting two approaches. Teoksessa Proceedings of the Conference on Human factors in computing systems, Boston, USA, Apr. 24&#8211;28, 1994, New York: ACM Press, 166&#8211;172.</li>
<li id="note-66">^ <a href="#ref-66_0" title=""><sup>a</sup></a> <a href="#ref-66_1" title=""><sup>b</sup></a> <a href="#ref-66_2" title=""><sup>c</sup></a> <a href="#ref-66_3" title=""><sup>d</sup></a> <a href="#ref-66_4" title=""><sup>e</sup></a> <a href="#ref-66_5" title=""><sup>f</sup></a> <a href="#ref-66_6" title=""><sup>g</sup></a> <a href="#ref-66_7" title=""><sup>h</sup></a> Perrott, D. R., Saberi, K., Brown, K. &amp; Strybel, T. Z. 1990. Auditory psychomotor coordination and visual search performance. Perception &amp; Psychophysics, 48(3), 214&#8211;226.</li>
<li id="note-67">^ <a href="#ref-67_0" title=""><sup>a</sup></a> <a href="#ref-67_1" title=""><sup>b</sup></a> <a href="#ref-67_2" title=""><sup>c</sup></a> Saue, S. 2000. A model for interaction in exploratory sonification displays. Teoksessa Proceedings of the International Conference on Auditory Display, Georgia Institute of Technology Atlanta, Georgia, USA, Apr. 2&#8211;5, 2000, 1&#8211;5.</li>
<li id="note-68">^ <a href="#ref-68_0" title=""><sup>a</sup></a> <a href="#ref-68_1" title=""><sup>b</sup></a> <a href="#ref-68_2" title=""><sup>c</sup></a> <a href="#ref-68_3" title=""><sup>d</sup></a> <a href="#ref-68_4" title=""><sup>e</sup></a> Sawhney, N. &amp; Schmandt, C. 1997. Design of spatialized audio in nomadic environments. Teoksessa Proceedings of the International Conference on Auditory Display, Palo Alto, CA, USA, Nov. 2&#8211;5, 1997, 109&#8211;113.</li>
<li id="note-69">^ <a href="#ref-69_0" title=""><sup>a</sup></a> <a href="#ref-69_1" title=""><sup>b</sup></a> <a href="#ref-69_2" title=""><sup>c</sup></a> Scaletti, C. &amp; Craig, A. B. 1991. Using sound to extract meaning from complex data. Teoksessa Proceedings SPIE, Vol. 1459, 207&#8211;219.</li>
<li id="note-70">^ <a href="#ref-70_0" title=""><sup>a</sup></a> <a href="#ref-70_1" title=""><sup>b</sup></a> Schaeffer, P. 1967. TraitÃ© des objets musicaux. Uudistettu painos. Paris: Seuil.</li>
<li id="note-71">^ <a href="#ref-71_0" title=""><sup>a</sup></a> <a href="#ref-71_1" title=""><sup>b</sup></a> <a href="#ref-71_2" title=""><sup>c</sup></a> <a href="#ref-71_3" title=""><sup>d</sup></a> <a href="#ref-71_4" title=""><sup>e</sup></a> <a href="#ref-71_5" title=""><sup>f</sup></a> <a href="#ref-71_6" title=""><sup>g</sup></a> <a href="#ref-71_7" title=""><sup>h</sup></a> <a href="#ref-71_8" title=""><sup>i</sup></a> <a href="#ref-71_9" title=""><sup>j</sup></a> <a href="#ref-71_10" title=""><sup>k</sup></a> <a href="#ref-71_11" title=""><sup>l</sup></a> <a href="#ref-71_12" title=""><sup>m</sup></a> <a href="#ref-71_13" title=""><sup>n</sup></a> <a href="#ref-71_14" title=""><sup>o</sup></a> <a href="#ref-71_15" title=""><sup>p</sup></a> <a href="#ref-71_16" title=""><sup>q</sup></a> <a href="#ref-71_17" title=""><sup>r</sup></a> <a href="#ref-71_18" title=""><sup>s</sup></a> <a href="#ref-71_19" title=""><sup>t</sup></a> <a href="#ref-71_20" title=""><sup>u</sup></a> <a href="#ref-71_21" title=""><sup>v</sup></a> <a href="#ref-71_22" title=""><sup>w</sup></a> <a href="#ref-71_23" title=""><sup>x</sup></a> <a href="#ref-71_24" title=""><sup>y</sup></a> <a href="#ref-71_25" title=""><sup>z</sup></a> <a href="#ref-71_26" title=""><sup>1</sup></a> <a href="#ref-71_27" title=""><sup>2</sup></a> <a href="#ref-71_28" title=""><sup>3</sup></a> <a href="#ref-71_29" title=""><sup>4</sup></a> <a href="#ref-71_30" title=""><sup>5</sup></a> <a href="#ref-71_31" title=""><sup>6</sup></a> Schafer, R. M. 1977. The tuning of the world. New York: Knopf.</li>
<li id="note-72"><a href="#ref-72" title="">^</a> Schmandt, C. &amp; Mullins, A. 1995. AudioStreamer: exploiting simultaneity for listening. Teoksessa Proceedings of the Conference on Human Factors and Computing Systems, Denver, Colorado, USA, 1995, New York: ACM Press, 218&#8211;219.</li>
<li id="note-73"><a href="#ref-73" title="">^</a> Smith, S., Pickett, R. M. &amp; Williams, M. G. 1994. Environments for exploring auditory representations of multidimensional data. Teoksessa G. Kramer (toim.) Auditory Display: Sonification, Audification and Auditory interfaces, Reading, MA, USA: Addison&#8211;Wesley Publishing Company, 167&#8211;183.</li>
<li id="note-74">^ <a href="#ref-74_0" title=""><sup>a</sup></a> <a href="#ref-74_1" title=""><sup>b</sup></a> <a href="#ref-74_2" title=""><sup>c</sup></a> Tarasti, E. 1990. Johdatusta semiotiikkaan: esseitä taiteen ja kulttuurin merkkijärjestelmistä. Helsinki: Gaudeamus.</li>
<li id="note-75"><a href="#ref-75" title="">^</a> Vanderveer, N. J. 1979. Ecological acoustics: human perception of environmental sounds. Dissertation Abstracts International. 40/09B, 4543. University Microfilms No. 8004002.</li>
<li id="note-76">^ <a href="#ref-76_0" title=""><sup>a</sup></a> <a href="#ref-76_1" title=""><sup>b</sup></a> <a href="#ref-76_2" title=""><sup>c</sup></a> <a href="#ref-76_3" title=""><sup>d</sup></a> Walker, A. &amp; Brewster, S. A. 2000. Spatial audio in small screen device displays. Personal Technologies, 4(2), 1&#8211;14.</li>
<li id="note-77">^ <a href="#ref-77_0" title=""><sup>a</sup></a> <a href="#ref-77_1" title=""><sup>b</sup></a> <a href="#ref-77_2" title=""><sup>c</sup></a> Walker, R. 1987. The effects of culture, environment, age, and musical training on choices of visual metaphors for sound. Perception &amp; Psychophysics, 42(5), 491&#8211;502.</li>
<li id="note-78">^ <a href="#ref-78_0" title=""><sup>a</sup></a> <a href="#ref-78_1" title=""><sup>b</sup></a> <a href="#ref-78_2" title=""><sup>c</sup></a> Warren, W. &amp; Verbrugge, R. 1984. Auditory perception of breaking and bouncing events: a case study in ecological acoustics. Journal of Experimental Psychology: Human Perception and Performance, 10(5), 704&#8211;712.</li>
<li id="note-79">^ <a href="#ref-79_0" title=""><sup>a</sup></a> <a href="#ref-79_1" title=""><sup>b</sup></a> Wenzel, E. M. 1992. Localization in virtual acoustic displays. Presence: Teleoperators and Virtual Environments, 1(1), 80&#8211;107.</li>
<li id="note-80">^ <a href="#ref-80_0" title=""><sup>a</sup></a> <a href="#ref-80_1" title=""><sup>b</sup></a> Wenzel, E. M. 1994. Spatial sound and sonification. Teoksessa G. Kramer (toim.) Auditory Display: Sonification, Audification and Auditory interfaces, Reading, MA, USA: Addison&#8211;Wesley Publishing Company, 127&#8211;150.</li>
<li id="note-81">^ <a href="#ref-81_0" title=""><sup>a</sup></a> <a href="#ref-81_1" title=""><sup>b</sup></a> <a href="#ref-81_2" title=""><sup>c</sup></a> Wenzel, E. M., Wightman, F. &amp; Kistler, D. J. 1991. Localization with non-individualized virtual acoustic display cues. Teoksessa Proceedings of the Conference on Human Factors in Computing Systems, New Orleans, Louisiana, USA, Apr. 27&#8211;May 2, 1991, New York: ACM Press, 351&#8211;359.</li>
<li id="note-82">^ <a href="#ref-82_0" title=""><sup>a</sup></a> <a href="#ref-82_1" title=""><sup>b</sup></a> <a href="#ref-82_2" title=""><sup>c</sup></a> <a href="#ref-82_3" title=""><sup>d</sup></a> Williams, S. M. 1994. Perceptual principles in sound grouping. Teoksessa G. Kramer (toim.) Auditory Display: Sonification, Audification and Auditory interfaces, Reading, MA, USA: Addison&#8211;Wesley Publishing Company, 95&#8211;125.</li>
<li id="note-83">^ <a href="#ref-83_0" title=""><sup>a</sup></a> <a href="#ref-83_1" title=""><sup>b</sup></a> Wu, J.&#8211;R., Duh C.&#8211;D., Ouhyoung, M. &amp; Wu, J.&#8211;T. 1997. Head motion and latency compensation on localization of 3D sound in virtual reality. Teoksessa Proceedings of the ACM Symposium on Virtual Reality Software and Technology, Lausanne, Switzerland, Sept. 15&#8211;17, 1997, New York: ACM Press, 15&#8211;20.</li>
</ol>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.akikoo.org/log/2002/06/12/thesis/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
