<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	>

<channel>
	<title>akikoo.org &#187; University</title>
	<atom:link href="http://www.akikoo.org/log/category/edu/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.akikoo.org</link>
	<description>akikoo.org &#124; the web home of Aki Karkkainen. Published from Brussels, Belgium.</description>
	<pubDate>Sun, 28 Dec 2008 18:11:00 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.7</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>University courses</title>
		<link>http://www.akikoo.org/log/2002/06/13/courses/</link>
		<comments>http://www.akikoo.org/log/2002/06/13/courses/#comments</comments>
		<pubDate>Thu, 13 Jun 2002 19:15:28 +0000</pubDate>
		<dc:creator>Aki Karkkainen</dc:creator>
		
		<category><![CDATA[University]]></category>

		<category><![CDATA[courses]]></category>

		<category><![CDATA[information systems science]]></category>

		<category><![CDATA[university]]></category>

		<guid isPermaLink="false">http://www.akikoo.org/log/2002/06/13/courses/</guid>
		<description><![CDATA[<p>This is a list of courses included in my Master of Science (Econ.) degree &#8211; 250 credit units all together.</p>]]></description>
			<content:encoded><![CDATA[<p>As a humble effort to document my life, here&#8217;s a list of courses included in my Master of Science (Econ.) degree &#8212; 250 credit units all together.<span id="more-21"></span></p>
<p>It&#8217;s just a plain list for me to remember what I&#8217;ve been studying, and maybe to show you what I&#8217;m interested in (or what I was obliged to study to finish the degree!). I&#8217;ll let you guess which subjects on this list I liked the most.</p>
<h3>Advanced studies in Information Systems Science</h3>
<ul>
<li>Basic Course in Electronic Commerce</li>
<li>Basic Course in Information Systems Development</li>
<li>Customer Behaviour in Cyber Space</li>
<li>Database Management Systems</li>
<li>Development Methods and Tools in Electronic Commerce</li>
<li>Groupware</li>
<li>Introduction to C Programming</li>
<li>Introduction to Communication Systems</li>
<li>Introduction to Networking Technology</li>
<li>Knowledge Work and its Tools</li>
<li><a href="/log/2002/06/12/thesis/">Master&#8217;s Thesis: Spatial sound in a user interface as a method to deliver hidden information and to relieve visual burden</a></li>
<li>Master&#8217;s Thesis Seminar</li>
<li>Maturity Examination</li>
<li>Object-oriented Information Systems Development</li>
<li>Operating Systems</li>
<li>Professional and Field Training</li>
<li>Research Methods</li>
<li>Seminar</li>
<li>Structured Information Systems Development</li>
<li>Systems Development Project</li>
<li>Theoretical Bases of Information Systems</li>
</ul>
<h3>Basic studies in Marketing</h3>
<ul>
<li>Basics in Marketing</li>
<li>Business to Business Marketing</li>
<li>International Marketing</li>
<li>Marketing Research and Information Systems</li>
</ul>
<h3>Basic studies in Multimedia</h3>
<ul>
<li>Constructing Multimedia Applications</li>
<li>Group Tutoring</li>
<li>Introduction to New Media</li>
<li>Multimedia Object Production</li>
<li>Multimedia Project</li>
<li>Optional Course in Multimedia</li>
</ul>
<h3>Language and Communication studies</h3>
<h4>English</h4>
<ul>
<li>Communication Skills</li>
<li>Optional Course</li>
<li>Text Workshop 1</li>
<li>Text Workshop 2</li>
</ul>
<h4>Finnish (mother tongue)</h4>
<ul>
<li>Communication and Negotiation Skills</li>
<li>Foundations of Written Communication</li>
</ul>
<h4>French</h4>
<ul>
<li>French 1</li>
<li>French 2</li>
<li>French 3</li>
<li>French 4</li>
<li>French Reading Comprehension</li>
<li>Remedial French</li>
</ul>
<h4>Swedish</h4>
<ul>
<li>Command of Swedish as the Second Language (Official Examination)</li>
<li>Optional Course</li>
</ul>
<h3>Other studies</h3>
<h4>Art History</h4>
<ul>
<li>Introduction to General Art History</li>
<li>Practical Course in Art History</li>
</ul>
<h4>Music</h4>
<ul>
<li>Arrangement</li>
<li>Big Band</li>
<li>Drums</li>
<li>History of Jazz Music</li>
<li>History of Western Art Music</li>
<li>Jazz Harmony</li>
<li>Jazz Workshop</li>
<li>Jazz Music Pedagogy</li>
<li>Piano</li>
</ul>
<h4>Philosophy</h4>
<ul>
<li>History of Philosophy 1</li>
<li>Introduction to Philosophy</li>
</ul>
<h4>Statistics</h4>
<ul>
<li>Basic Course in Statistics</li>
</ul>
<h3>General studies</h3>
<ul>
<li>Basics of Operational Research and Mathematics</li>
<li>Introduction to Scientific Research</li>
<li>Orientation to University Studies</li>
<li>Preliminary Course in Information Technology</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.akikoo.org/log/2002/06/13/courses/feed/</wfw:commentRss>
		</item>
		<item>
		<title>Spatial sound in a user interface as a method to deliver hidden information and to relieve visual burden</title>
		<link>http://www.akikoo.org/log/2002/06/12/thesis/</link>
		<comments>http://www.akikoo.org/log/2002/06/12/thesis/#comments</comments>
		<pubDate>Wed, 12 Jun 2002 12:54:09 +0000</pubDate>
		<dc:creator>Aki Karkkainen</dc:creator>
		
		<category><![CDATA[University]]></category>

		<category><![CDATA[computer]]></category>

		<category><![CDATA[information]]></category>

		<category><![CDATA[interface]]></category>

		<category><![CDATA[sound]]></category>

		<category><![CDATA[Spatial]]></category>

		<guid isPermaLink="false">http://www.akikoo.org/journal/edu/2002/15</guid>
		<description><![CDATA[<span class="fi">In Finnish</span> Spatiaalinen ääni graafisessa käyttöliittymässä. Pro gradu -tutkielma Jyväskylän yliopistossa 2002.]]></description>
			<content:encoded><![CDATA[<p>Spatiaalinen ääni käyttöliittymässä piiloinformaation välittäjänä ja visuaalisen kuorman keventäjänä. <em>Tietojärjestelmätieteen pro gradu&#8211;tutkielma, 12.6.2002, Aki Kärkkäinen.</em> Jyväskylän yliopisto, Tietojenkäsittelytieteiden laitos, Jyväskylä.</p>
<h3>Sisällysluettelo</h3>
<ul class="thesisNav">
<li id="toc-abstract"><a title="Tiivistelmä" href="#abstract">Tiivistelmä</a></li>
<li id="toc-acknowledgements"><a title="Kiitokset" href="#acknowledgements">Kiitokset</a></li>
<li id="toc-1"><a title="Johdanto" href="#ch-1">1.Johdanto</a>
<ul class="thesisNav">
<li id="toc-1_1"><a title="Tutkimuksen taustaa" href="#ch-1_1">1.1 Tutkimuksen taustaa</a></li>
<li id="toc-1_2"><a title="Tutkimustehtävä" href="#ch-1_2">1.2 Tutkimustehtävä</a></li>
<li id="toc-1_3"><a title="Sovellettavat tieteenalat ja tutkimuksen rakenne" href="#ch-1_3">1.3 Sovellettavat tieteenalat ja tutkimuksen rakenne</a></li>
</ul>
</li>
<li id="toc-2"><a title="Kuuntelemalla tietoa maailmasta" href="#ch-2">2. Kuuntelemalla tietoa maailmasta</a>
<ul class="thesisNav">
<li id="toc-2_1"><a title="Ääni ja sen eteneminen korvaan" href="#ch-2_1">2.1 Ääni ja sen eteneminen korvaan</a></li>
<li id="toc-2_2"><a title="Äänten ryhmittely" href="#ch-2_2">2.2 Äänten ryhmittely</a></li>
<li id="toc-2_3"><a title="Aistihavaintojärjestelmät" href="#ch-2_3">2.3 Aistihavaintojärjestelmät</a></li>
<li id="toc-2_4"><a title="Audiovisuaalinen sopimus" href="#ch-2_4">2.4 Audiovisuaalinen sopimus</a></li>
<li id="toc-2_5"><a title="Jokapäiväinen ja musiikillinen kuuntelu" href="#ch-2_5">2.5 Jokapäiväinen ja musiikillinen kuuntelu</a></li>
<li id="toc-2_6"><a title="Syntaktiset ja semanttiset tekijät äänten tunnistamisessa" href="#ch-2_6">2.6 Syntaktiset ja semanttiset tekijät äänten tunnistamisessa</a></li>
</ul>
</li>
<li id="toc-3"><a title="Spatiaalinen ääni" href="#ch-3">3 Spatiaalinen ääni</a>
<ul class="thesisNav">
<li id="toc-3_1"><a title="Äänen paikantaminen" href="#ch-3_1">3.1 Äänen paikantaminen</a></li>
<li id="toc-3_2"><a title="Siirtofunktio" href="#ch-3_2">3.2 Siirtofunktio</a></li>
<li id="toc-3_3"><a title="Äänen synteettinen spatialisointi" href="#ch-3_3">3.3 Äänen synteettinen spatialisointi</a></li>
<li id="toc-3_4"><a title="Auralisaatio" href="#ch-3_4">3.4 Auralisaatio</a></li>
<li id="toc-3_5"><a title="Kaiutin- ja kuulokeäänentoiston vastakkainasettelu" href="#ch-3_5">3.5 Kaiutin- ja kuulokeäänentoiston vastakkainasettelu</a></li>
<li id="toc-3_6"><a title="Äänen spatialisoinnin ongelmat" href="#ch-3_6">3.6 Äänen spatialisoinnin ongelmat</a></li>
<li id="toc-3_7"><a title="Spatiaalista ääntä hyödyntäviä sovelluksia" href="#ch-3_7">3.7 Spatiaalista ääntä hyödyntäviä sovelluksia</a></li>
</ul>
</li>
<li id="toc-4"><a title="Äänimaisema-analyysi käyttöliittymässä" href="#ch-4">4. Äänimaisema-analyysi käyttöliittymässä</a>
<ul class="thesisNav">
<li id="toc-4_1"><a title="Hiljaisuus" href="#ch-4_1">4.1 Hiljaisuus</a></li>
<li id="toc-4_2"><a title="Äänen käyttötarkoitus" href="#ch-4_2">4.2 Äänen käyttötarkoitus</a></li>
<li id="toc-4_3"><a title="Ikoniset äänet" href="#ch-4_3">4.3 Ikoniset äänet</a></li>
<li id="toc-4_4"><a title="Symboliset äänet" href="#ch-4_4">4.4 Symboliset äänet</a></li>
<li id="toc-4_5"><a title="Metaforiset äänet" href="#ch-4_5">4.5 Metaforiset äänet</a></li>
<li id="toc-4_6"><a title="Äänitapahtumien luokittelujärjestelmät" href="#ch-4_6">4.6 Äänitapahtumien luokittelujärjestelmät</a></li>
</ul>
</li>
<li id="toc-5"><a title="Keskustelua" href="#ch-5">5. Keskustelua</a>
<ul class="thesisNav">
<li id="toc-5_1"><a title="Tulokset" href="#ch-5_1">5.1 Tulokset</a></li>
<li id="toc-5_2"><a title="Johtopäätökset" href="#ch-5_2">5.2 Johtopäätökset</a></li>
</ul>
</li>
<li id="toc-6"><a title="Yhteenveto" href="#ch-6">6. Yhteenveto</a></li>
<li id="toc-refs"><a title="Lähteet" href="#refs">Lähteet</a></li>
<li>Kuviot
<ul>
<li>KUVIO 1. Objektin äänellinen ja visuaalinen esitys</li>
<li>KUVIO 2. Binauraalinen äänitys ja toisto</li>
<li>KUVIO 3. Siirtofunktioiden  mittaus ja simulointi</li>
</ul>
</li>
<li>Taulukot
<ul>
<li>TAULUKKO 1. Äänitutkimuksen kategoriat</li>
<li>TAULUKKO 2. Tutkimuksen tulokset</li>
</ul>
</li>
</ul>
<div id="abstract">
<h3>Tiivistelmä <a title="takaisin sisällysluetteloon" href="#toc-abstract">^</a></h3>
<p>Tutkimuksessa tarkastellaan spatiaalista ääntä graafisen käyttöliittymän laajentajana. Tavoitteena on tutkia, miten ääntä voitaisiin käyttää grafiikan kanssa piiloinformaation välittämisessä. Käsitteellis-teoreettisen analyysin avulla pyritään sijoittamaan keskeiset käsitteet laajempaan viitekehykseen.</p>
<p>Tutkimuksessa tarkastellaan ensin kuuntelemiseen ja äänen paikantamiseen liittyviä seikkoja, jonka jälkeen esitetään synteettisen spatialisoinnin periaate ja sen toteutukseen liittyvät ongelmat. Tämän jälkeen spatiaalista ääntä tarkastellaan käyttöliittymäkontekstissa semioottisessa viitekehyksessä.</p>
<p>Tulokset osoittavat, että spatiaalisia &#8212; syntaksia noudattavia &#8212; jokapäiväisiä äänitapahtumia voidaan liittää käyttöliittymän tehtäviin ja objekteihin paljastamalla siten muutoin piiloon jäävää informaatiota. Jatkotutkimusaiheita on runsaasti psykoakustiikan, käytännön sovellusten ja akustisen ekologian piirissä. Erityisesti liikkuvan tietojenkäsittelyn pienikokoisissa laitteissa äänen merkitys korostunee tulevaisuudessa, visuaalisen informaation määrän supistuessa.</p>
<p>AVAINSANAT:    akustinen ekologia, auralisaatio, käyttöliittymä, piiloinformaatio, psykoakustiikka, spatialisointi, äänen paikantaminen, ikoninen ääni</p>
</div>
<div id="acknowledgements">
<h3>Kiitokset <a title="takaisin sisällysluetteloon" href="#toc-acknowledgements">^</a></h3>
<p>Kiitän seuraavia henkilöitä ja laitoksia, joita ilman tämä työ ei olisi syntynyt (tai ainakin sen tekeminen olisi ollut paljon tylsempää):</p>
<p>Jyväskylässä työn tarkastajat Seppo Puuronen ja Kai Tuuri, Jyväskylän yliopisto, opiskelijavaihdon järjestäjä Leena Uski, Panu Varstala, Henna Välikangas, Isä ja Äiti.</p>
<p>Pariisissa XYZ-yhteisön suuret säätäjät Tauri Kankaanpää ja Juha Oravala, vuokraisännät Gilles Martin ja Wolfgang Kukulies, yleinen tuki ja turva Laëtitia Kulyk, Montmartren kämppäkaverit Bettina Ortmann ja Mariné Pereira, janoisen kirjoittajan virkistävät keitaat Ed, Leaderprice ja Monoprix, kannettava kirjoituskone HyperBook 2300SLC/486 (&#8221;piip!&#8221;), multimedian mekka Centre Pompidou, Cité des Sciences et de l&#8217;Industrie (La Villette), IRCAM (Institut de Recherche et Coordination Acoustique/Musique), M.S.COM Espace Internet (&#8221;Quinze minutes, s&#8217;il vous plaît!&#8221;), Université de la Sorbonne nouvelle Paris III (Cinéma et Audiovisuel).</p>
</div>
<div id="ch-1">
<h3>1. Johdanto <a title="takaisin sisällysluetteloon" href="#toc-1">^</a></h3>
<p>Luvussa esitellään ensin aihepiiri ja sen rajaukset, jonka jälkeen määritellään tutkimusongelma sekä eri tieteenalojen osuus tutkimuksessa.</p>
</div>
<div id="ch-1_1">
<h4>1.1 Tutkimuksen taustaa <a title="takaisin sisällysluetteloon" href="#toc-1_1">^</a></h4>
<p>Miksi ääntä pitäisi käyttää käyttöliittymässä? Onko ääni vain turha ja irrallinen elementti, joka häiritsee keskittymistä tehtävään? Tällaisia kysymyksiä esitetään yleensä silloin, kun äänisuunnittelu on tehty puutteellisesti tai kun sitä ei osata tehdä. Vaikka kuulolla koettu ilmiö edustaa fenomenologisesti yhtä varmaa tietoa kuin näöllä koettu, nähtyä pidetään objektiivisena ja kuultua subjektiivisena tietona<sup id="ref-54_0" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 13)">[54]</a></sup>. Äänen hyödyntäminen graafisissa käyttöliittymissä onkin toistaiseksi jäänyt todella vähäiseksi. Grafiikkaa ja ääntä on kuitenkin käytännössä vaikea erottaa toisistaan. Niiden tulisikin tukea ja täydentää toisiaan siten, ettei kumpikaan ole täydellinen ilman toista.</p>
<p>Mikä sitten voisi olla äänen tuottama lisäarvo graafisessa käyttöliittymässä? Chionin<sup id="ref-33_0" class="ref"><a href="#note-33" title="(Chion 1990, 5)">[33]</a></sup> mukaan ääni rikastuttaa kuvaa antamalla vaikutelman, että ääni on &#8220;turha&#8221;, samaan aikaan kun ääni tuo esille ja voimistaa sen, mitä kuvassa jo on (mutta joka ei tulisi esille ilman ääntä!). Vaikka Chion puhuu yksinomaan elokuvasta, näkökulma on silti mielenkiintoinen ja sovellettavissa käyttöliittymään: se sisältää ajatuksen, että ääni voi olla informatiivinen ja ekspressiivinen olematta silti häiritsevä. Ääni on kuulunut elokuvaan jo 70 vuotta<sup id="ref-33_1" class="ref"><a href="#note-33" title="(Chion 1990, 142)">[33]</a></sup>, miksei tämä kehitys kuuluisi myös käyttöliittymissä?</p>
<p>Ääntä on perinteisesti käytetty käyttöliittymässä varoitus- tai ilmoitusmerkityksessä tai tunnelman luomisessa (lähinnä pelit ja multimediasovellukset). Äänen tarkoituksena on ollut myös auttaa näkövammaisia työskentelemään tietokoneen kanssa. Ajatus on luonnollinen sikäli, että käytetäänhän grafiikkaakin vain näkeviä ihmisiä varten. Tällainen näkökulma on kuitenkin liian rajoittunut. Tuntuu keinotekoiselta ajatella, että näkevät ihmiset käyttäisivät graafista käyttöliittymää ja näkövammaiset kuulokäyttöliittymää. Käsite kuulokäyttöliittymä on &#8212; toisin kuin graafinen tai merkkipohjainen käyttöliittymä &#8212; vielä verraten harvinainen.</p>
<p>Kuulokäyttöliittymätutkimus on perinteisesti jakautunut kahteen tutkimushaaraan: graafisen käyttöliittymän laajentamiseen äänen avulla (auditory interface, auditory display) ja näkövammaisille tarkoitettuun, graafisen käyttöliittymän korvaavaan kuulokäyttöliittymään (audio-only interface, nonvisual interface). Käsitteet menevät osittain päällekkäin; joskus auditory interface saattaa viitata myös näkövammaisille tarkoitettuun käyttöliittymään (ks. Edwards<sup id="ref-38_0" class="ref"><a href="#note-38" title="(Edwards 1988)">[38]</a></sup>. Pääasia on, että käsitteillä viitataan informaation esittämiseen käyttöliittymässä äänen avulla.</p>
<p>Ensin täytyy kuitenkin selvittää, minkälaisia ääniä käytetään. Tässä tutkimuksessa keskitytään synteettisiin tai luonnollisiin ei-puheääniin, koska puheääni on (a) hidasta, (b) ärsyttävää kuunnella ja (c) liian huomiota vaativaa. Informaatiota voi jäädä piiloon (hidden information) esimerkiksi siksi, että näyttöön on ahdettu liikaa visuaalista informaatiota<sup id="ref-16_0" class="ref"><a href="#note-16" title="(Blattner, Papp III &amp; Glinert 1994, 448)">[16]</a></sup>. Cohenin<sup id="ref-35_0" class="ref"><a href="#note-35" title="(Cohen 1994, 500)">[35]</a></sup> mielestä tietokoneen näyttö ei yksinkertaisesti ole tarpeeksi suuri kyetäkseen näyttämään visuaalisesti kaikki käynnissä olevat toiminnot. Suuri osa näistä toiminnoista tapahtuu käyttäjä &#8220;selän takana&#8221;, oli sitten kyseessä käyttäjän alullepanema toiminto tai jokin käyttäjää kohti suuntautuva toiminto.<sup id="ref-35_1" class="ref"><a href="#note-35" title="(Cohen 1994, 500)">[35]</a></sup>.</p>
<p>Ensiksi mainittu tutkimushaara (graafisen käyttöliittymän laajentaminen) jakaantuu kolmeen pääsuuntaukseen: <em>ikonisiin ääniin</em> (auditory icons), <em>symbolisiin ääniin</em> (earcons) ja <em>sonifikaatioon</em> (sonification). Ikoniset äänet perustuvat jokapäiväisen kuuntelun tuottamaan informaatioon<sup id="ref-42_0" class="ref"><a href="#note-42" title="(Gaver 1986, 168)">[42]</a></sup>. Symboliset äänet ovat abstrakteja, synteettisiä ääniä, joita voidaan käyttää strukturoidusti äänellisten viestien esittämiseen käyttöliittymässä<sup id="ref-22_0" class="ref"><a href="#note-22" title="(Brewster, Wright &amp; Edwards 1993, 222)">[22]</a></sup>. Sonifikaatio tarkoittaa ohjelmien tuottaman tiedon esittämistä äänen avulla<sup id="ref-51_0" class="ref"><a href="#note-51" title="(Hereford &amp; Winn 1994, 219)">[51]</a></sup>.</p>
<p>Herefordin ja Winnin<sup id="ref-51_1" class="ref"><a href="#note-51" title="(Hereford ja Winn 1994, 212--213)">[51]</a></sup> mukaan äänellä on käyttöliittymässä kaksi funktiota: ääni (a) kertoo käyttäjälle järjestelmän tilasta kullakin hetkellä hälytysäänillä tai &#8220;tarkkailee&#8221; taustalla kunnes käyttäjä vaatii tietoa järjestelmän tilasta ja (b) välittää ohjelmien tuottamaa tietoa. Hereford ja Winn<sup id="ref-51_2" class="ref"><a href="#note-51" title="(Hereford ja Winn 1994, 213)">[51]</a></sup> luokittelevat ikoniset ja symboliset äänet ryhmään (a) ja sonifikaation ryhmään (b). Sonifikaatio sivuutetaan tässä tutkimuksessa. Jälkimmäinen tutkimushaara (näkövammaisille tarkoitetun käyttöliittymän tutkimus) rajataan myöskin tämän tutkimuksen ulkopuolelle. Aihepiiriä ovat lähestyneet ainakin Edwards<sup id="ref-38_1" class="ref"><a href="#note-38" title="(Edwards 1988)">[38]</a></sup>, Mynatt ja Weber<sup id="ref-65" class="ref"><a href="#note-65" title="(Mynatt ja Weber 1994)">[65]</a></sup> sekä Mereu ja Kazman<sup id="ref-64" class="ref"><a href="#note-64" title="(Mereu ja Kazman 1996)">[64]</a></sup>.</p>
<p>Ihmisen ja koneen vuorovaikutusta tarkasteltaessa tulisi käyttää sateenkaarikäsitettä käyttöliittymä, johon on integroitu useita toisiaan tukevia modaliteetteja. Modaliteetilla viitataan tässä yhteydessä Dannenbergin ja Blattnerin<sup id="ref-36" class="ref"><a href="#note-36" title="(Dannenberg ja Blattner 1992, xxiii)">[36]</a></sup> mukaisesti siihen aistiin, jolla informaatio havaitaan. Brownin, Newsomen ja Glinertin<sup id="ref-27_0" class="ref"><a href="#note-27" title="(Brown, Newsome ja Glinert 1989, 339)">[27]</a></sup> mukaan visuaalisen informaation liiallinen määrä voi laskea tehokkuutta tehtävän suorituksessa. Jakamalla informaatiota useille eri aisteille voidaan näköaistin ylikuormitusta lievittää.<sup id="ref-27_1" class="ref"><a href="#note-27" title="(Brown ym. 1989, 339)">[27]</a></sup>. Huomioitavaa on silti se, että vaikka lähes kaikki käyttöliittymät ovatkin nykyään multimediakäyttöliittymiä, ne eivät silti ole multimodaalisia, koska hyödyntävät vain grafiikkaa<sup id="ref-21_0" class="ref"><a href="#note-21" title="(Brewster 1994, 8)">[21]</a></sup>. Laitteisto on jo valmiina, kunhan vain tiedettäisiin mitä sillä pitäisi tehdä.</p>
<p>Tässä tutkimuksessa käyttöliittymää tarkastellaan yleisellä tasolla, ei laite- tai järjestelmätasolla (vrt. esimerkiksi Brewster, Leplatre &amp; Crease<sup id="ref-25_0" class="ref"><a href="#note-25" title="(Brewster, Leplatre &amp; Crease (1998))">[25]</a></sup>, jotka ovat tutkineet äänen käyttöä liikkuvan tietojenkäsittelyn sovelluksissa). Käyttäjän oletetaan kommunikoivan koneen kanssa perinteisesti näppäimistön ja hiiren (tai muun osoittimen) avulla (input) ja saavan palautetta äänen avulla (output), Brewsterin<sup id="ref-20" class="ref"><a href="#note-20" title="(Brewster 1991, 18)">[20]</a></sup> tapaan. Näin aihetta voidaan tarkastella poikkitieteellisesti, pääpainon ollessa ihmisen ja tietokoneen vuorovaikutuksessa. Vuorovaikutuksen onnistuminen riippuu paljolti siitä, saako ihminen koneen tekemään halutun tehtävän pienimmällä mahdollisella käytön opettelemisella<sup id="ref-51_3" class="ref"><a href="#note-51" title="(Hereford &amp; Winn 1994, 212--213)">[51]</a></sup>. Tutkimuksessa ei käsitellä äänen käyttöä jaetuissa työtiloissa tai tietokoneavusteisessa ryhmätyössä (ks. Ackerman, Starr, Hindus &amp; Mainwaring<sup id="ref-1" class="ref"><a href="#note-1" title="(Ackerman, Starr, Hindus &amp; Mainwaring 1997)">[1]</a></sup>.</p>
<p>Koska vuorovaikutuksen täytyy käyttöliittymässä olla nopeaa, äänten täytyy (a) olla lyhyitä ja (b) soida samanaikaisesti (toisin kuin peleissä tai elokuvissa, joissa immersiivisyys on tärkeämpää kuin tehokkuus; nämä eivät kuitenkaan välttämättä sulje toisiaan pois). Toisaalta Kramerin<sup id="ref-60_0" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup> mukaan ääni voi myös olla pitkä, jos sen tarkoituksena on välittää informaatiota taustaprosessista. Oli kyseessä sitten jääkaapin hurina, liikenne tai linnunlaulu, mukaudumme pysyviin, staattisiin äänielementteihin. Kuulemme yksittäiset äänet vasta keskityttyämme niihin tietoisesti tai kun ne vaativat  huomiotamme yhtäkkisen muutoksen kautta.<sup id="ref-60_1" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup>.</p>
<p>Ihmisellä on kyky erotella ja sijoittaa äänet tietyistä suunnista tuleviksi<sup id="ref-5" class="ref"><a href="#note-5" title="(Arons 1992, 35)">[5]</a></sup>. Tämä ns. cocktail party effect (kyky valita yksi äänivirta useista samanaikaisista äänivirroista<sup id="ref-48_0" class="ref"><a href="#note-48" title="(Gibson 1966, 84)">[48]</a></sup>) mahdollistaa äänten spatiaalisen sijoittelun käyttöliittymässä. Samalla tavalla kuin voimme näköaistin avulla havaita useita visuaalisia objekteja samanaikaisesti, voimme spatiaalisesti kuulla useita eri ääniobjekteja samanaikaisesti ja keskittyä johonkin niistä. <em>Spatialisaatiossa</em> luodaan synteettisesti kolmiulotteinen äänikenttä, jossa äänet tuntuvat tulevan tietyistä paikallistettavista suunnista kuulijan pään ulkopuolelta<sup id="ref-50_0" class="ref"><a href="#note-50" title="(Goose &amp; Möller 1999, 363)">[50]</a></sup>. <em>Auralisaatio</em> taas tarkoittaa prosessia, jonka tarkoituksena on luoda jokin kolmiulotteinen virtuaalitila &#8212; joko sisä- tai ulkotilassa &#8212; simuloimalla äänilähteiden suuntaa ja huonekaikua<sup id="ref-13_0" class="ref"><a href="#note-13" title="(Begault 1994, 145)">[13]</a></sup>. Käytännössä nämä kaksi käsitettä ovat hyvin lähellä toisiaan. Tässä tutkimuksessa auralisaatiolla tarkoitetaan koko virtuaalisen kuuloympäristön luontiprosessia, spatialisaation viitatessa enemminkin signaalinprosessointitekniikkaan.</p>
<p>Visuaalisia objekteja voidaan sijoittaa näytölle värien avulla, jolloin objektit erottuvat nopeammin toisistaan<sup id="ref-32" class="ref"><a href="#note-32" title="(Carter 1982, 127)">[32]</a></sup>. Ääniobjektien (-tapahtumien) käytössä ja sijoittelussa sen sijaan on käytetty lähinnä ad hoc&#8211;menetelmiä riippuen käytettävästä laitteistosta, ohjelmistosta ja sovelluksen luonteesta. Ennen ääniobjektien sijoittelua tilassa täytyy käytettäville äänille luoda luokittelujärjestelmä, jonka tarkoituksena on antaa merkitys kullekin äänelle ja sen sijainnille tilassa.</p>
</div>
<div id="ch-1_2">
<h4>1.2 Tutkimustehtävä <a title="takaisin sisällysluetteloon" href="#toc-1_2">^</a></h4>
<p>Aiemmissa tutkimustuloksissa esitetyt strukturoidut menetelmät äänen käytölle eivät ole olleet riittäviä, koska kukin näistä menetelmistä on keskittynyt vain johonkin kapeaan osa-alueeseen. TAULUKOSSA 1 on esitetty yleisen äänitutkimuksen kategoriat Schaferin<sup id="ref-71_0" class="ref"><a href="#note-71" title="(Schafer 1977, 148)">[71]</a></sup> mukaan. Kendall<sup id="ref-57_0" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup> lisää edelliseen vielä neuropsykologian, jossa tutkitaan kuulokokemuksen neurologisia rakenteita. Se, samoin kuin akustiikka ja äänen estetiikka kuuluvat tämän tutkimuksen ulkopuolelle (sikäli kuin näin tarkkoja rajauksia voi edes tehdä). Schafer<sup id="ref-71_1" class="ref"><a href="#note-71" title="(Schafer 1977)">[71]</a></sup> on tehnyt akustisen äänimaiseman tutkimusta (soundscape), joka liittyy läheisesti myös akustiseen ekologiaan (acoustic ecology) (vrt. Gaver<sup id="ref-44_0" class="ref"><a href="#note-44" title="(Gaver 1993a)">[44]</a></sup><sup id="ref-46_0" class="ref"><a href="#note-46" title="(Gaver 1993c)">[46]</a></sup>).</p>
<table id="table-1" summary="Äänitutkimuksen kategoriat Schaferin (1977) mukaan">
<caption>TAULUKKO 1. Äänitutkimuksen kategoriat <a title="takaisin sisällysluetteloon" href="#toc-table_1">^</a></caption>
<colgroup><col class="areaCol" /><col class="personCol" /><col class="issueCol" /></colgroup>
<thead>
<tr>
<th scope="col">Alue</th>
<th scope="col">Tutkija</th>
<th scope="col">Tutkimusongelma</th>
</tr>
</thead>
<tbody>
<tr class="odd">
<td>Äänen akustiikka</td>
<td>fyysikko, insinööri</td>
<td>Mitä äänet ovat?</td>
</tr>
<tr>
<td>Äänen psykoakustiikka</td>
<td>psykologi, fysiologi, kognitiotieteilijä</td>
<td>Miten äänet havaitaan?</td>
</tr>
<tr class="odd">
<td>Äänen semantiikka</td>
<td>kielitieteilijä, viestintätieteilijä</td>
<td>Mitä äänet tarkoittavat?</td>
</tr>
<tr>
<td>Äänen estetiikka</td>
<td>säveltäjä, musiikkitieteilijä</td>
<td>Miltä äänet tuntuvat?</td>
</tr>
</tbody>
</table>
<p>Schafer<sup id="ref-71_2" class="ref"><a href="#note-71" title="(Schafer 1977, 205)">[71]</a></sup> määrittelee akustisen ekologian tutkimusalaksi, jossa tarkastellaan äänimaiseman akustisten ilmiöiden suhdetta ja vaikutusta siinä elävien olentojen käyttäytymiseen. Määritelmän perusteella akustinen ekologia on täysin sovellettavissa käyttöliittymään, joka muodostaa oman vuorovaikutteisen äänimaisemansa.</p>
<p>Tämän tutkimuksen pääpaino sijoittuu pääasiassa psykoakustiikan, semiotiikan ja akustisen ekologian välimaastoon, jolloin saadaan toisaalta tietoa kuulokokemuksesta psyykkisenä prosessina, ja toisaalta tietoa ääniobjektien ominaisuuksista, sijainnista ja merkityksistä ympäröivässä maailmassa. Tämän jälkeen merkitykset voidaan liittää käyttöliittymäkontekstiin.</p>
<p>Keskeiseksi ongelmaksi muodostuu se, miten ääni voitaisiin integroida grafiikan kanssa. Äänen tulisi tukea tavoitteellista toimintaa, immersiivisyys voi käyttöliittymässä tulla kyseeseen vasta toiminnallisuuden varmistamisen jälkeen. Tavoitteena on löytää akustisesta ääniympäristöstämme hyödyllisiä spatiaalisia metaforia ja ikonisia ääniä piilossa olevan informaation organisoimiseen ja esittämiseen käyttöliittymässä yhdessä näköaistin välittämän informaation kanssa.</p>
<p>Kirjallisuuden pohjalta on tarkoitus koota yhteen äänitutkimukseen liittyviä käsitteitä ja teoreettisia viitekehyksiä. Tämän jälkeen käsitteitä tarkastellaan laajemmassa semioottisessa ja akustisen ekologian viitekehyksessä. Aihe on vaikea, koska yleistysten teko on hankalaa johtuen ihmisten kulttuuritaustoista sekä erilaisista äänen havainnointi- ja paikantamistaidoista. Aihetta tarkastellaan tässä tutkimuksessa normaalin näön omaavien keskivertokäyttäjien ja -havainnoijien näkökulmasta. Edellisen perusteella <em>tutkimusongelma muodostuu seuraavasta kahdesta osaongelmasta:</em></p>
<ol>
<li>Miten spatiaalista ääntä voitaisiin käyttää yhdessä grafiikan kanssa piilossa olevien objektien tai tapahtumien esittämisessä, tehtävän suorituksessa ja merkityksenannossa?</li>
<li>Voidaanko sellaista spatiaalista ääntä, joka ei selvästi viittaa käyttöliittymän tapahtumiin tai objekteihin, käyttää piiloinformaation välittämisessä?</li>
</ol>
<p>Tutkimus jakaantuu siten kahteen pääteemaan: (a) spatiaalisen äänen tuottamaan merkityssisältöön ja (b) ympäristön spatiaalisten äänten hyödyntämiseen ja liittämiseen käyttöliittymän objekteihin. Taustaolettamuksena ovat kuuloaistin funktiot Gibsonin<sup id="ref-48_1" class="ref"><a href="#note-48" title="(Gibson 1966, 75)">[48]</a></sup> mukaan: äänen suunnan havaitseminen ja äänilähteen tunnistaminen. Vaikka kyseessä on teoreettinen tutkimus, tutkimustulosten odotetaan hyödyttävän käyttöliittymäsuunnittelijoita myös käytännössä. Äänellinen käyttöliittymäsuunnittelu on aloitettava ihmisestä käsin, ja edettävä vasta sitten tekniseen toteutukseen. Tutkimuksen hyödyllisimpänä puolena lienee se, että siinä pyritään kattamaan laajempi alue kuin aiemmissa tutkimuksissa &#8212; joskin verraten yleisellä tasolla &#8212; ja luomaan laajennettu viitekehys spatiaalisen äänen informaation välittämistä ja tavoitteellista toimintaa tukevasta käytöstä käyttöliittymässä.</p>
</div>
<div id="ch-1_3">
<h4>1.3 Sovellettavat tieteenalat ja tutkimuksen rakenne<a title="takaisin sisällysluetteloon" href="#toc-1_3">^</a></h4>
<p>Tutkimuksessa käytetään kirjallisuutta soveltuvin osin akustisesta ekologiasta, kognitiivisesta psykologiasta ja viestintätieteistä. Viestintätieteiden osalta tutkimuksessa käytetään Fisken<sup id="ref-40_0" class="ref"><a href="#note-40" title="(Fiske 2000)">[40]</a></sup> esittämää jakoa prosessikoulukuntaan ja semioottiseen koulukuntaan. Vaikka Fiske jakaa viestintätieteiden teoriat edellämainittuihin koulukuntiin, niiden välinen raja on usein häilyvä. Prosessikoulukunnan mukaan viestintä on sanomien siirtoa ja jos vaikutus eroaa tarkoitetusta, viestintä on epäonnistunut. Tällöin käydään läpi viestinnän eri vaiheita vian löytämiseksi.</p>
<p>Semioottisen koulukunnan mukaan viestintä taas on merkitysten tuottamista ja vaihtoa. Tärkeää on se, kuinka sanomat (useimmiten tekstit, tässä yhteydessä äänet) ja ihmiset toimivat vuorovaikutuksessa tuottaakseen merkityksiä. Väärinkäsitykset eivät välttämättä todista viestinnän epäonnistuneen, vaan ne saattavat johtua lähettäjän ja vastaanottajan kulttuurieroista.<sup id="ref-40_1" class="ref"><a href="#note-40" title="(Fiske 2000, 14--15)">[40]</a></sup>. Pääpaino tässä tutkimuksessa on semioottisessa lähestymistavassa. Kognitiotieteiden osalta keskitytään muistin asettamiin rajoituksiin sekä seriaaliin ja paralleeliin tiedonkäsittelyyn.</p>
<p>Tutkimus etenee seuraavasti: <a title="Luku 2" href="#ch-2">Luvussa 2</a> perehdytään siihen, miten kuuloaistin avulla saadaan tietoa maailmasta sekä verrataan kuulo- ja näköaistia keskenään. <a title="Luku 3" href="#ch-3">Luvussa 3</a> tarkastellaan niitä tekijöitä, joiden perusteella ääni paikannetaan tietystä suunnasta tulevaksi sekä esitetään synteettisen spatialisoinnin periaate ja toteutukseen liittyvät ongelmat. <a title="Luku 4" href="#ch-4">Luvussa 4</a> analysoidaan spatiaalista äänimaisemaa käyttöliittymäkontekstissa. <a title="Luku 5" href="#ch-5">Luvussa 5</a> kootaan yhteen tutkimuksen keskeiset tulokset ja verrataan niitä aiempiin tutkimuksiin. Lopuksi <a title="Yhteenveto" href="#ch-6">yhteenvedossa</a> pohditaan jatkotutkimusaiheita.</p>
</div>
<div id="ch-2">
<h3>2. Kuuntelemalla tietoa maailmasta <a title="takaisin sisällysluetteloon" href="#toc-2">^</a></h3>
<p>Tässä luvussa tarkastellaan, miten saamme kuuntelemalla tietoa maailmasta yhdistämällä tätä tietoa aiempiin kokemuksiimme. Luku on synteesi kuuntelemisen psykoakustisista, havainnollisista, syntaktisista ja semanttisista tekijöistä, ja samalla perustelu semioottiselle lähestymistavalle.</p>
</div>
<div id="ch-2_1">
<h4>2.1 Ääni ja sen eteneminen korvaan <a title="takaisin sisällysluetteloon" href="#toc-2_1">^</a></h4>
<p>Ääni on sekä semanttinen että fysikaalinen käsite<sup id="ref-11_0" class="ref"><a href="#note-11" title="(Beaudouin--Lafon &amp; Gaver 1994, 49--50)">[11]</a></sup>. Äänen akustisia piirteitä kuvataan fysikaalisilla suureilla (kuten taajuudella), kun taas elämyksellinen äänimaailma muodostuu lukuisista äänielämyksiin liittyvistä piirteistä<sup id="ref-54_1" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 15)">[54]</a></sup>. Jauhiaisen<sup id="ref-54_2" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 26--27)">[54]</a></sup> mukaan <em>ääni fysikaalisena käsitteenä</em> on äänilähteestä pallomaisesti kaikkiin suuntiin etenevää molekyylien värähtelyä, joka etenee väliaineessa aaltomaisina tihentymä- ja harventumavaiheina. Eri aineiden rajapintoja kohdatessaan ääni <q>osittain heijastuu, osittain imeytyy toiseen aineeseen, absorboituu ja jatkaa kulkuaan toisessa aineessa</q><sup id="ref-54_3" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 37)">[54]</a></sup>.</p>
<p>Äänen aaltoliikettä kuvataan aallonpituudella, taajuudella ja amplitudilla. Jauhiaisen<sup id="ref-54_4" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 26--27)">[54]</a></sup> mukaan <em>aallonpituus</em> on etäisyys ääniaallon tihentymisvaiheesta toiseen, ja <em>taajuus</em> (frequency, yksikkönä hertsi, Hz) ilmoittaa värähdysten lukumäärän sekunnissa kuvaten äänen korkeutta. <em>Amplitudi</em> tarkoittaa värähtelyn laajuutta eli poikkeamaa keskiarvosta ja ilmaisee siten äänen voimakkuutta. <em>Äänes</em> eli <em>puhdas ääni</em> tarkoittaa ääntä, joka sisältää vain yhden taajuuden.<sup id="ref-54_5" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 26--27)">[54]</a></sup>. Gibsonin<sup id="ref-48_2" class="ref"><a href="#note-48" title="(Gibson 1966, 87)">[48]</a></sup> mielestä tällainen puhdas ääni aiheuttaa vain merkityksettömän aistimuksen. Merkitykselliset äänet koostuvat hänen mukaansa paljon monimutkaisemmista variaatioista. Jauhiainen<sup id="ref-54_6" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 26--27)">[54]</a></sup> huomauttaa, että käytännössä kaikki ympäristössä kuulemamme äänet koostuvat useasta samanaikaisesta eri taajuisesta värähtelystä. Tällaista ääntä kutsutaan seosääneksi, jonka taajuussisällön kuvausta kutsutaan äänen <em>spektriksi</em>. Spektri sisältää siis äänen perustaajuuden ja sen harmoniset osaäänekset kullakin hetkellä.<sup id="ref-54_7" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 26--27)">[54]</a></sup><sup id="ref-49_0" class="ref"><a href="#note-49" title="(Goldstein 1999, 312--313)">[49]</a></sup>. Ääni voi olla jokin luonnollinen akustisen ilmiön ääni tai koneellisesti aikaansaatu, synteettinen ääni<sup id="ref-53_0" class="ref"><a href="#note-53" title="(Huopaniemi 1999, 43--44)">[53]</a></sup>. Ääni etenee kuulijan korvaan sekä suoraan että heijastuen seinistä, lattioista ja katosta tai huonekaluista<sup id="ref-54_8" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 38)">[54]</a></sup>. Ääniaallot saavuttavat ensin korvalehden, joka ohjaa aallot korvakäytävän kautta tärykalvolle ja edelleen syvemmälle kuuloelimiin<sup id="ref-54_9" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 43--44)">[54]</a></sup>. <em>Ääni elämyksellisenä käsitteenä</em> sen sijaan koostuu neljästä peruspiirteestä:</p>
<ul>
<li>äänen voimakkuudesta kvantitatiivisena ominaisuutena (loudness)</li>
<li>äänen korkeudesta kvalitatiivisena ominaisuutena (pitch)</li>
<li>äänen ajallisuus- ja paikallisuusominaisuuksista.</li>
</ul>
<p>Äänielämys muodostaa yksittäisen olion elämysavaruudessa, ja äänielämykset muuttuvat nopeasti ajassa ja seuraavat toinen toistaan<sup id="ref-54_10" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 15--16)">[54]</a></sup>. Havaitsemamme äänimaailma (auditory scene, auditory space) muodostuu useista samanaikaisista äänivirroista (auditory stream), jotka voimme erottaa toisistaan ja joita voimme kuunnella selektiivisesti<sup id="ref-54" class="ref"><a href="#note-54_11" title="(Jauhiainen 1995, 19)">[54]</a></sup>. Tässä yhteydessä voimme rinnastaa äänielämyksen äänivirtaan (ks. tarkemmin <a title="kohta 2.2" href="#ch-2_2">kohta 2.2</a>). Jauhiaisen<sup id="ref-54_12" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 18--19)">[54]</a></sup> mukaan äänen ajallisuus ja paikallisuus ovat tässä ja nyt koettuja, ja siten tärkeämpiä piirteitä elämyksessä kuin voimakkuus ja korkeus. Äänen paikantamisen avulla voimme mieltää itsemme suhteessa ympäröivään fyysiseen äänimaailmaan.<sup id="ref-54_13" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 18--19)">[54]</a></sup>.</p>
<p>Kun kaksi korkeudeltaan ja voimakkuudeltaan samantasoista ääntä kuulostaa erilaiselta, kyse on erosta äänen <em>värissä</em> (timbre). Äänen väri muodostuu äänen syttymisen (attack), sammumisen (decay) ja äänen harmonisen rakenteen perusteella.<sup id="ref-49_1" class="ref"><a href="#note-49" title="(Goldstein 1999, 318, 356)">[49]</a></sup>. Oleellista ei kuitenkaan ole äänen merkityksetön jakaminen korkeuteen, voimakkuuteen tai kestoon, vaan se, miten äänilähteet erotellaan toisistaan merkityksellisten tapahtumien havaitsemiseksi ja luokittelemiseksi hierarkioihin<sup id="ref-48_3" class="ref"><a href="#note-48" title="(Gibson 1966, 89)">[48]</a></sup>. Jauhiaisen<sup id="ref-54_14" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 15)">[54]</a></sup> mielestä lyhytkestoiset äänielämykset sisältävät rajoitetusti merkityssisältöä, kun taas pitempikestoiset äänielämykset muodostavat mielekkäitä kokonaisuuksia sisältäen paitsi tietoa äänilähteiden ominaisuuksista, myös äänen välittämiä käsitteellisiä, tunnepitoisia, esteettisiä, arvostuksellisia tai tahtomista ilmaisevia merkityksiä. Jauhiaisen näkemys on äärimmäisen yksinkertaistettu: se ei määrittele, mikä on lyhyt ja mikä pitkä ääni, eikä liioin ota huomioon kontekstin merkitystä. Lyhytkin ääni voi olla tietyssä kontekstissa erittäin merkitsevä.</p>
<p>Mansur ym.<sup id="ref-62_0" class="ref"><a href="#note-62" title="(Mansur ym. 1985, 117)">[62]</a></sup> jakavat äänen seuraaviin parametreihin: korkeus, voimakkuus, spatiaalinen sijainti, kesto, sointiväri, äänen syttyminen sekä ajoitus. Niin vähän kuin nämä erottelut kertovatkin äänten monimutkaisesta rakenteesta, ne auttavat hahmottamaan tutkimusaluetta ja jakamaan sen pienempiin kokonaisuuksiin. Tässä tutkimuksessa keskitytään ainoastaan äänielämyksen ajallisuuden ja paikallisuuden dynaamiseen suhteeseen sekä niiden sisältämään informaatiosisältöön (merkitykseen) käyttöliittymässä. Selvyyden vuoksi jatkossa puhutaan pelkästään äänestä (tai ääniobjektista/ -tapahtumasta, ks. <a title="kohta 2.4" href="#ch-2_4">kohta 2.4</a>).</p>
</div>
<div id="ch-2_2">
<h4>2.2 Äänten ryhmittely <a title="takaisin sisällysluetteloon" href="#toc-2_2">^</a></h4>
<p>Ryhmittelemme ääniä erillisiksi <em>äänivirroiksi</em> (auditory stream)<sup id="ref-60_2" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup>. Bregmanin ja Campbellin<sup id="ref-19_0" class="ref"><a href="#note-19" title="(Bregman ja Campbell 1971, 244)">[19]</a></sup> mukaan äänivirta muodostuu samanlaisista äänitapahtumista, jotka erotellaan muista samanaikaisista äänitapahtumista. Bregman ja Campbell<sup id="ref-19_1" class="ref"><a href="#note-19" title="(Bregman ja Campbell 1971, 244)">[19]</a></sup> olettavat, että kuuntelija voi suunnata huomionsa vain yhteen äänivirtaan kerrallaan. Äänivirta mentaalisena kokemuksena vastaa visuaalisen objektin kokemista ja on siten analoginen suhteessa hahmopsykologiaan (Gestalt)<sup id="ref-55_0" class="ref"><a href="#note-55" title="(Jones 1993, 98)">[55]</a></sup><sup id="ref-73" class="ref"><a href="#note-73" title="(Smith, Pickett &amp; Williams 1994, 174)">[73]</a></sup><sup id="ref-82_0" class="ref"><a href="#note-82" title="(Williams 1994, 97)">[82]</a></sup>. Äänivirran ja aistikanavan (ks. Broadbent<sup id="ref-26" class="ref"><a href="#note-26" title="(Broadbent 1958)">[26]</a></sup>) ero Bregmanin ja Campbellin<sup id="ref-19_2" class="ref"><a href="#note-19" title="(Bregmanin ja Campbell 1971, 249)">[19]</a></sup> mukaan on siinä, että äänivirta on kullakin hetkellä järjestelty kokonaisuus, eikä sitä voida määritellä yhtenä fyysisenä ominaisuutena. Äänivirran funktiona on järjestellä äänimateriaali ensin, jonka jälkeen aistikanava voi prosessoida tätä äänimateriaalia yksi äänivirta kerrallaan<sup id="ref-19_3" class="ref"><a href="#note-19" title="(Bregman &amp; Campbell 1971, 249)">[19]</a></sup>. Chion<sup id="ref-33_2" class="ref"><a href="#note-33" title="(Chion 1990, 13)">[33]</a></sup>, Ballas<sup id="ref-7" class="ref"><a href="#note-7" title="(Ballas 1994, 80)">[7]</a></sup> ja Williams<sup id="ref-82_1" class="ref"><a href="#note-82" title="(Williams 1994, 96)">[82]</a></sup> painottavat, että äänivirta on havaintoon perustuva tulkinta äänilähteestä, eikä siis vastaa äänilähteen aiheuttamaa fysikaalista tapahtumaa. Williamsin<sup id="ref-82_2" class="ref"><a href="#note-82" title="(Williams 1994, 96--97)">[82]</a></sup> mielestä ideaalitilanteessa ollaan silloin, kun havaitsemamme äänivirta sisältää vain äänilähteen tunnistamisessa tarvittavan keskeisen informaation. Tämä on tärkeä huomio: turha informaatio voidaan poistaa suunniteltaessa ääniä käyttöliittymään.</p>
<p>Williams<sup id="ref-82_3" class="ref"><a href="#note-82" title="(Williams 1994, 96)">[82]</a></sup> määrittelee äänten ryhmittelyn havainnolliseksi prosessiksi, jossa kuuntelija erottelee akustisesta signaalista saadun informaation yksittäisiksi merkityksellisiksi äänitapahtumiksi. Kuuntelija voi kuunnella yhtä äänilähdettä ja samalla kuulla, mutta olla kiinnittämättä huomiotaan muihin äänilähteisiin<sup id="ref-48_4" class="ref"><a href="#note-48" title="(Gibson 1966, 83)">[48]</a></sup>. Goldstein<sup id="ref-49_2" class="ref"><a href="#note-49" title="(Goldstein 1999, 359--362)">[49]</a></sup> esittää yleiset periaatteet äänten ryhmittelylle. Äänet ryhmitellään ensinnäkin niiden sijainnin perusteella. Äänet, jotka ovat peräisin yksittäisestä äänilähteestä, tulevat yleensä yhdestä sijainnista äänellisestä avaruudesta. Näin ollen voimme erottaa vasemmalla puolellamme käydyn hiljaisen keskustelun takanamme käydystä äänekkäästä keskustelusta osittain siksi, että ne sijoittuvat eri paikkoihin. Juuri paikantamisen avulla kykenemme havaitsemaan ja erottelemaan äänet toisistaan (<a title="Luku 3" href="#ch-3">luvussa 3</a> käsitellään tätä tarkemmin).</p>
<p>Äänen sijainti ei kuitenkaan ole keskeinen (eikä ainoa) tekijä erottelun kannalta: voimme kuunnella kamariorkesteria yhdestä kaiuttimesta ja silti selkeästi erotella yksittäiset soittimet<sup id="ref-41_0" class="ref"><a href="#note-41" title="(Fitch &amp; Kramer 1994, 308)">[41]</a></sup>. Kuulohavaintojärjestelmämme pystyy siis erottelemaan useita äänivirtoja &#8220;akustisesta suosta&#8221; yhtä aikaa ilman että meidän täytyisi turvautua spatiaalisiin vihjeisiin<sup id="ref-41_1" class="ref"><a href="#note-41" title="(Fitch &amp; Kramer 1994, 308)">[41]</a></sup>. Goldsteinin<sup id="ref-49_3" class="ref"><a href="#note-49" title="(Goldstein 1999, 359--362)">[49]</a></sup> mukaan äänet ryhmitellään sijainnin lisäksi niiden äänenvärin, sävelkorkeuden ja esiintymistiheyden perusteella. Äänet jotka alkavat ja loppuvat eri aikaan, ryhmitellään eri ryhmiin, kun taas äänet, jotka ovat staattisia ja jatkuvia, ryhmitellään samasta äänilähteestä tulevaksi.<sup id="ref-49_4" class="ref"><a href="#note-4" title="(Goldstein 1999, 359--362)">[49]</a></sup>.</p>
</div>
<div id="ch-2_3">
<h4>2.3 Aistihavaintojärjestelmät <a title="takaisin sisällysluetteloon" href="#toc-2_3">^</a></h4>
<p>Gibson<sup id="ref-48_5" class="ref"><a href="#note-48" title="(Gibson 1966, 47)">[48]</a></sup> korostaa aistien olevan aktiivisia mieluummin kuin passiivisia, järjestelmiä enemmän kuin kanavia ja enemmän toistensa kanssa vuorovaikutuksessa olevia kuin toisensa poissulkevia. Gibson kutsuukin aisteja <em>aktiivisiksi havaintojärjestelmiksi</em> (perceptual systems).<sup id="ref-48_6" class="ref"><a href="#note-48" title="(Gibson 1966, 47)">[48]</a></sup>. Tämä on tärkeä huomio: on tehtävä ero kuulemisen ja kuuntelemisen välillä (samoin kuin näkemisen ja katsomisen välillä). Ihmisen kuulohavaintojärjestelmä mahdollistaa kuulemisen (passiivista), kun taas kuunteleminen on ihmisen aktiivista toimintaa<sup id="ref-48_7" class="ref"><a href="#note-48" title="(Gibson 1966, 49--51)">[48]</a></sup>. Gibsonin<sup id="ref-48_8" class="ref"><a href="#note-48" title="(Gibson 1966, 83)">[48]</a></sup> mielestä kuulohavaintojärjestelmä on kuuntelemista varten; kuuleminen sen sijaan on sattumanvaraista.</p>
<p>Kuulohavaintojärjestelmän funktiona ei siis ole vain kuulemisen mahdollistaminen, vaan aktiivinen äänilähteen suunnan havaitseminen (ks. <a title="Luku 3" href="#ch-3">luku 3</a>), jolloin voimme suuntautua ääntä kohti (tai siitä poispäin!), sekä äänilähteen luonteen havaitseminen, jolloin kykenemme tunnistamaan sen<sup id="ref-48_9" class="ref"><a href="#note-48" title="(Gibson 1966, 75)">[48]</a></sup> (ks. <a title="Luku 4" href="#ch-4">luku 4</a>).</p>
</div>
<div id="ch-2_4">
<h4>2.4 Audiovisuaalinen sopimus <a title="takaisin sisällysluetteloon" href="#toc-2_4">^</a></h4>
<p>Chion<sup id="ref-33_3" class="ref"><a href="#note-33" title="(Chion 1990, 9)">[33]</a></sup> käyttää abstraktia käsitettä <em>audiovisuaalinen sopimus</em> (audiovisual contract) kuvaamaan äänellisen ja visuaalisen havainnon vuorovaikutteista suhdetta. Kuuntelija/katselija sulauttaa mielessään äänen ja kuvan yhdeksi kokonaisuudeksi<sup id="ref-33_4" class="ref"><a href="#note-33" title="(Chion 1990, 9)">[33]</a></sup>. Kysymykset &#8220;mitä kuulen siinä minkä näen?&#8221; ja &#8220;mitä näen siinä minkä kuulen?&#8221; ilmentävät audiovisuaalista sopimusta<sup id="ref-33_5" class="ref"><a href="#note-33" title="(Chion 1990, 192)">[33]</a></sup>. Seuraavassa tarkastellaan tätä kuulo- ja näköaistin suhdetta sekä kokonaisuutena että kummankin aistin kohdalla erikseen, jotta saadaan selville kunkin vahvimmat puolet. Tässä tutkimuksessa audiovisuaalinen sopimus viittaa äänen ja kuvan yhtäaikaiseen esittämiseen multimodaalissa käyttöliittymässä.</p>
<p>Kun edellisessä kohdassa määrittelimme kuuntelemisen aktiiviseksi toiminnaksi, on tarpeen pohtia sitä, miten se eroaa katselemisesta. Ensinnäkin, voimme kuunnella ja paikantaa sellaisia objekteja, joita emme näe<sup id="ref-60_3" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup>. Schaeffer<sup id="ref-70_0" class="ref"><a href="#note-70" title="(Schaeffer 1967, 91--99)">[70]</a></sup> kutsuu tätä akusmaattiseksi kuuntelemiseksi (acousmatic listening)<sup id="ref-33_6" class="ref"><a href="#note-33" title="(Chion 1990, 71)">[33]</a></sup>. Siinä missä näköaistin avulla keskitymme vain yhteen suuntaan ja saamme yksityiskohtaista tietoa silloisessa (rajoittuneessa) näköpiirissämme olevista objekteista, voimme kuuloaistin avulla tarkkailla ympäristöämme samanaikaisesti kaikista suunnista<sup id="ref-60_4" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup>. Tässä on ratkaiseva ero: enemmän kuin puolet senhetkisestä ympäristöstä jää näköpiirimme ulkopuolelle<sup id="ref-66_0" class="ref"><a href="#note-66" title="(Perrott, Saberi, Brown &amp; Strybel 1990, 214)">[66]</a></sup>. Perrottin ym.<sup id="ref-66_1" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 214)">[66]</a></sup> mukaan tässä kapeassa näköpiirissä informaation prosessointikapasiteetti on verraten rajattu, ollen tehokkainta vain katseen keskipisteen ympärillä. Kuuloaistimme avulla voimme siis määritellä, mitkä osat ympäristöstämme tuodaan näköaistin alueelle<sup id="ref-48_10" class="ref"><a href="#note-48" title="(Gibson 1966, 83)">[48]</a></sup><sup id="ref-66_2" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 214--215)">[66]</a></sup><sup id="ref-79_0" class="ref"><a href="#note-79" title="(Wenzel 1992, 81)">[79]</a></sup>.</p>
<p>Perrott ym.<sup id="ref-66_3" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 219)">[66]</a></sup> osoittivat tutkimuksessaan, että akustinen spatiaalinen informaatio auttaa löytämään näytöltä objektin nopeammin, kun kohde on näkökentän ulkopuolella. Vielä merkittävämpää tutkimuksessa on kuitenkin se, että myös näkökentän keskellä oleva kohde löytyi spatiaalisen äänen avulla nopeammin kuin pelkästään näön avulla<sup id="ref-66_4" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 224)">[66]</a></sup>. Heidän hypoteesinsa, että kuulohavaintojärjestelmän ensisijainen funktio on osoittaa silmille minne katsoa<sup id="ref-66_5" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 214)">[66]</a></sup>, saa siten vahvistusta. Äänen avulla voidaan siis saada tietoa taka-alan prosesseista. Perrott ym.<sup id="ref-66_6" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 215)">[66]</a></sup> toteavat, että ihmiset painottavat kuitenkin enemmän visuaalista informaatiota kuin minkään muun aistin tuottamaa informaatiota. Tämä saattaa olla tunnusomaista länsimaiselle kulttuurille (jonka piirissä tietokoneiden kehitys jostain syystä tapahtuukin). Luultavasti tästä syystä käyttöliittymissä on käytetty yksinomaan visuaalista modaliteettia.</p>
<p>Toinen oleellinen ero suuntautumisen lisäksi on ajallisuus ja spatiaalisuus. Chionin<sup id="ref-33_7" class="ref"><a href="#note-33" title="(Chion 1990, 11, 136)">[33]</a></sup> sekä Fitchin ja Kramerin<sup id="ref-41_2" class="ref"><a href="#note-41" title="(Fitch ja Kramer 1994, 308)">[41]</a></sup> mukaan näköaistin vahvuutena on objektien spatiaalinen havaitseminen, jolloin kuuloaistille jää niiden ajallinen ulottuvuus. Perrott ym.<sup id="ref-66_7" class="ref"><a href="#note-66" title="(Perrott ym. 1990, 219)">[66]</a></sup> sekä Fitch ja Kramer<sup id="ref-41_3" class="ref"><a href="#note-41" title="(Fitch ja Kramer 1994, 322--323)">[41]</a></sup> olettavat, että näköaisti on kehityksen kuluessa tottunut prosessoimaan spatiaalisia objekteja peräkkäisesti (jolloin katselijan täytyy silmien liikkeellä käydä kaikki objektit läpi), kun taas kuuloaisti on erikoistunut useiden väliaikaisten objektien havaitsemiseen samanaikaisesti. Näkemys on vahvasti yksinkertaistettu: spatiaaliset ja ajalliset ulottuvuudet menevät aistien kesken myös limittäin, kuten saamme myöhemmin huomata (ks. myös Gibson<sup id="ref-48_11" class="ref"><a href="#note-48" title="(Gibson 1966)">[48]</a></sup>). Tällainen keinotekoinen erottelu on kuitenkin hyödyllinen, koska sen avulla päästään tarkastelemaan kuulon ja näön keskeisiä eroavaisuuksia. Erottelulla on myös fysikaaliset perusteet: Gibsonin<sup id="ref-48_12" class="ref"><a href="#note-48" title="(Gibson 1966, 49--51)">[48]</a></sup> ja Gaverin<sup id="ref-43_0" class="ref"><a href="#note-43" title="(Gaver 1989, 71)">[43]</a></sup> mukaan näkö perustuu valon heijastukseen erilaisista pinnoista, kun taas ääni on seurausta materiaalien värähtelystä (aiheuttaen ilman värähtelyä).</p>
<p>Emme voi kuulla ilmanpaineen absoluuttista arvoa, vain sen muutoksen ajassa<sup id="ref-69_0" class="ref"><a href="#note-69" title="(Scaletti &amp; Craig 1991, 210)">[69]</a></sup>. Äänen ajallisen ominaisuuden vuoksi se voidaan hyvin liittää animoituun grafiikkaan; staattinen visuaalinen ikoni ei välttämättä kuvaa ääntä parhaalla mahdollisella tavalla<sup id="ref-69_1" class="ref"><a href="#note-69" title="(Scaletti &amp; Craig 1991, 210)">[69]</a></sup><sup id="ref-16_1" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 455)">[16]</a></sup>. Gaver<sup id="ref-43_1" class="ref"><a href="#note-43" title="(Gaver (1989, 70--71)">[43]</a></sup> on päässyt asian ytimeen seuraavalla toteamuksellaan: &#8220;sound exists in time and over space, vision exists in space and over time&#8221;. Hänen mukaansa äänet ovat olemassa ajassa, jolloin niiden alku ja loppu huomataan usein; sitä vastoin visuaaliset objektit ovat pysyviä ja niiden ilmestyminen tai häipyminen huomataan vain satunnaisesti. Ääntä ei välttämättä kuulla kuin kerran, mutta visuaalista objektia voi aina katsoa uudestaan. Tästä syystä ääni sopii erityisen hyvin kuvaamaan väliaikaisia tapahtumia (kausaaliset tapahtumat, esimerkiksi oven sulkeminen; ks. Fitch &amp; Kramer<sup id="ref-41_4" class="ref"><a href="#note-41" title="(Fitch &amp; Kramer 1994, 324)">[41]</a></sup>), kun taas  staattisia objekteja voidaan paremmin kuvata visuaalisesti. Toisaalta visuaaliset objektit saattavat tukkia näytön kokonaan. Gaver pohtii, että visuaalisia objekteja voidaan sijoittaa samanaikaisesti useisiin paikkoihin ja että spatiaalisten samanaikaisten äänten määrä on rajoitetumpi kuin visuaalisten objektien.<sup id="ref-43_2" class="ref"><a href="#note-43" title="(Gaver (1989, 71)">[43]</a></sup>.</p>
<p>Niin tärkeitä kuin Gaverin huomiot ovatkin, hänen näkökulmansa tässä suhteessa on selvästi rajoittunut ja aikansa tuote: tässä tutkimuksessa tullaan osoittamaan, että spatiaalisen äänen avulla voidaan onnistuneesti esittää useita objekteja samanaikaisesti, jolloin myös visuaalisten objektien suma näytöllä hälvenee. Ääni todellakin on kiinni ajassa; tästä on osoituksena se, ettei ääniä ole säilynyt menneiltä ajoilta, toisin kuin visuaalisia esineitä. Vasta äänen tallennustekniikoiden ansiosta ääntä on voitu vangita ja toistaa aina uudelleen.</p>
<p>Edellä on ollut puhetta visuaalisesta ja äänellisestä <em>objektista</em> ja <em>äänitapahtumasta</em>. Mikä sitten on näiden ero, ja miten objekti määritellään? Visuaaliset objektit voidaan nähdä ja niiden rajat ovat selvät. Fitchin ja Kramerin<sup id="ref-41_5" class="ref"><a href="#note-41" title="(Fitch ja Kramer 1994, 308)">[41]</a></sup> mukaan objektin spatiaalinen sijainti ja osien yhtenäisyys määrittävät visuaalisen objektin, jolloin näyttö voidaan helposti jakaa erillisiksi komponenteiksi. Ääniobjektin kohdalla tilanne on pulmallisempi: miten määritellä ääniobjektin rajat? Tähän on useita tapoja: (a) sijoittamalla äänet spatiaalisesti, (b) määrittelemällä objekti vuorovaikutuksessa toisen objektin kanssa, tai (c) Kramerin<sup id="ref-60_5" class="ref"><a href="#note-60" title="(Kramer 1994, 12)">[60]</a></sup> tapaan joko liikuttamalla ääntä sijainnista toiseen tai liikuttamalla subjektia äänen läpi. Kramer (ks. myös Blattner ym.<sup id="ref-16_2" class="ref"><a href="#note-16" title="Blattner ym. 1994, 454)">[16]</a></sup>) siis ajattelee ääniobjektin rajaavan &#8220;palan&#8221; äänellisestä tilasta juuri liikkeensä avulla. Tässä tutkimuksessa ääniobjektien erottamiseksi on valittu spatiaalinen ja paikallaan pysyvä ääni.</p>
<p>Eräs pohdittava asia on myös se, onko ääniobjekti yksi ääni vai sarja nopeita, peräkkäisiä ääniä. Jones<sup id="ref-55_1" class="ref"><a href="#note-55" title="(Jones 1993, 98)">[55]</a></sup> kutsuu äänellistä tapahtumaa objektiksi, perustellen sen olevan analoginen suhteessa visuaaliseen objektiin. Schafer<sup id="ref-71_3" class="ref"><a href="#note-71" title="(Schafer 1977, 129--130)">[71]</a></sup> puolestaan nimittää laboratorioissa toistettavia ääniä (siis kontekstistaan irrotettuja ääniä) ääniobjekteiksi, kun taas äänitapahtumiksi sellaisia ääniä, jotka tapahtuvat tietyssä paikassa tiettynä aikana ja aiheuttavat siten merkityksen. Tällöin ne viittaavat kontekstiin, jossa ne tapahtuvat, sisältäen alun, keskikohdan ja lopun. Teollisen ajan keinotekoiset äänet sisältävät lähes yksinomaan äänen keskikohdan ilman selkeää alkua tai loppua, toisin kuin luonnolliset äänet<sup id="ref-71_4" class="ref"><a href="#note-71" title="(Schafer 1977, 130)">[71]</a></sup>.</p>
<p>Tässä tutkimuksessa käytetään tästä eteenpäin käsitteitä äänitapahtuma ja ääniobjekti rinnakkain, jälkimmäisen viitatessa sen visuaaliseen vastineeseen. Oleellista on se, mitä ääni tarkoittaa eri konteksteissa ja se, että peräkkäisten äänten järjestys on looginen. Tähän asiaan palataan kohdassa 2.6. Äänimaisema muodostuu vuorovaikutteisista äänitapahtumista, jotka puolestaan syntyvät erilaisten vuorovaikutusten tuloksena<sup id="ref-16_3" class="ref"><a href="#note-16" title="Blattner ym. 1994, 454)">[16]</a></sup>. Blattnerin ym.<sup id="ref-16_4" class="ref"><a href="#note-16" title="Blattner ym. 1994, 454)">[16]</a></sup> mielestä assosioimalla spatiaalinen ääni vastaavaan visuaaliseen objektiin myös ääni muistetaan paremmin.</p>
<p>Ääni siis perustuu vaihteluihin ajassa ja viittaa yleensä muutokseen ja tilan tarkkailuun<sup id="ref-18_0" class="ref"><a href="#note-18" title="(Bly 1982, 374)">[18]</a></sup><sup id="ref-79_1" class="ref"><a href="#note-79" title="(Wenzel 1992, 81)">[79]</a></sup><sup id="ref-60_6" class="ref"><a href="#note-60" title="(Kramer 1994, 4)">[60]</a></sup><sup id="ref-76_0" class="ref"><a href="#note-76" title="(Walker &amp; Brewster 2000, 2)">[76]</a></sup>, kuvan ollessa joko staattinen tai liikkuva (animoitu). Esimerkkinä tilan muutoksesta on viinipullosta lähtevä ääni sen tyhjentyessä. Chionin<sup id="ref-33_8" class="ref"><a href="#note-33" title="(Chion 1990, 9--10)">[33]</a></sup> mielestä kuitenkin myös ääni voi joissain tilanteissa ilmaista staattisuutta; tällöin äänessä ei ole mitään variaatioita. Tällaisia ääniä ovat esimerkiksi puhelimen valintaääni, kaiuttimen hurina tai jokin äänisilmukka. On vaikea olla kuulematta äänessä edes vähäisiä vihjeitä epäsäännöllisyydestä tai liikkeestä.<sup id="ref-33_9" class="ref"><a href="#note-33" title="(Chion 1990, 9--10)">[33]</a></sup>. Käyttöliittymäkontekstissa on kuitenkin tärkeää, ettei ääni ole staattinen, vaan että sillä on aina jokin selkeä funktio.</p>
<p>Edellä esitetyn perusteella päädytään esittämään Scalettin ja Craigin<sup id="ref-69_2" class="ref"><a href="#note-69" title="(Scalett ja Craig 1991, 210)">[69]</a></sup> käyttämä malli, johon myös tämä tutkimus pohjimmiltaan perustuu. Mallin ideana on, että reaalimaailman objektit voidaan esittää monella tavalla, tässä tapauksessa joko äänen tai kuvan avulla. Objekteilla voidaan olettaa olevan sekä visuaalisia että äänellisiä ulottuvuuksia<sup id="ref-16_5" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 465)">[16]</a></sup>. Olettamuksena siis on, että katseleminen täydentää kuuntelemista ja toisinpäin: tästä seuraa, että saman objektin tarjoama äänellinen tai kuvallinen informaatio voi tilanteesta riippuen olla myös toisteista. KUVIOSSA 1 on havainnollistettu tätä mallia. Seuraavassa kohdassa tarkastellaan kahta erilaista kuuntelemisen tapaa.</p>
</div>
<div id="ch-2_5">
<h4>2.5 Jokapäiväinen ja musiikillinen kuuntelu <a title="takaisin sisällysluetteloon" href="#toc-2_5">^</a></h4>
<p>Gaver<sup id="ref-43_3" class="ref"><a href="#note-43" title="(Gaver 1989, 72--73)">[43]</a></sup> <sup id="ref-44_1" class="ref"><a href="#note-44" title="(Gaver 1993a, 286)">[44]</a></sup><sup id="ref-46_1" class="ref"><a href="#note-46" title="(Gaver 1993c, 1--2)">[46]</a></sup> tekee eron <em>musiikillisen</em> ja <em>jokapäiväisen</em> kuuntelemisen välillä: edellinen viittaa ääniaallon fyysisten attribuuttien havaitsemiseen (esimerkiksi äänen korkeus), ja jälkimmäinen äänilähteiden havaitsemiseen ympäristössämme. Gaverin mielestä emme oven sulkeutuessa kuule siitä aiheutuvan äänen korkeutta, vaan sen sijaan saatamme havaita oven koon, materiaalin ja sulkemiseen käytetyn voiman.<sup id="ref-43_4" class="ref"><a href="#note-43" title="(Gaver 1989, 72--73)">[43]</a></sup>. Keskeistä Gaverin ajattelussa on se, että jokapäiväisessä elämässämme emme kuule ääniä itsessään, sellaisenaan, vaan äänilähteen ominaisuuksia tietyssä kontekstissa. Näkökulma perustuu Gibsonin<sup id="ref-48_13" class="ref"><a href="#note-48" title="(Gibson 1966)">[48]</a></sup> ajatuksiin. Chion<sup id="ref-33_10" class="ref"><a href="#note-33" title="(Chion 1990, 25)">[33]</a></sup> kutsuu tätä kausaaliseksi kuuntelemiseksi. Chionin<sup id="ref-33_11" class="ref"><a href="#note-33" title="(Chion 1990, 26--27)">[33]</a></sup> mielestä kontekstistaan irrotetun yksittäisen äänen tunnistaminen on vaikeaa: saatamme tunnistaa vain äänilähteen yleiset piirteet, esimerkiksi &#8220;jonkin koneellisen äänen&#8221;. Chionin mielestä voimme kuulla äänen kausaalisesti, eli siis kuulla ja tunnistaa raapimisen tai aistia sen nopeuden, mutta sen sijaan emme kuule mikä raapii mitä<sup id="ref-33_12" class="ref"><a href="#note-33" title="(Chion 1990, 26--27)">[33]</a></sup>.</p>
<p><img id="figure-1" src="http://www.akikoo.org/wp-content/themes/aksu/images/object.png" alt="Objektin äänellinen ja visuaalinen esitys" /></p>
<h5>KUVIO 1. Objektin äänellinen ja visuaalinen esitys <a title="takaisin sisällysluetteloon" href="#toc-figure_1">^</a></h5>
<p>Chion<sup id="ref-33_13" class="ref"><a href="#note-33" title="(Chion 1990, 27)">[33]</a></sup> painottaa, että ääni on seurausta vähintään kahdesta äänilähteestä. Chion siis erottaa äänilähteen vuorovaikutuksen muodosta ja eroaa siten hieman Gaverin teoriasta. Chion<sup id="ref-33_14" class="ref"><a href="#note-33" title="(Chion 1990, 28)">[33]</a></sup> käyttää vielä nimitystä semanttinen kuunteleminen, joka tarkoittaa viestin tulkitsemista tietyn koodin tai kielen avulla. Käytännössä semanttinen ja jokapäiväinen kuunteleminen tarkoittaa samaa asiaa: kyse on äänten tulkitsemisesta. Gaver<sup id="ref-46_2" class="ref"><a href="#note-46" title="(Gaver (1993c, 18)">[46]</a></sup> painottaa, ettei jokapäiväistä kuuntelua voi tutkia pelkästään äänilähteiden fyysisten ominaisuuksien perusteella; tärkeintä on se, mitä kuuntelijat havaitsevat.</p>
<p>Psykologit ovat perinteisesti olleet kiinnostuneita juuri musiikilliseen kuunteluun vaikuttavista havainnollisista ilmiöistä, vaikka suurin osa jokapäiväisestä kuuntelusta ei sitä ole<sup id="ref-46_3" class="ref"><a href="#note-46" title="(Gaver 1993c, 1--2)">[46]</a></sup>. Gaver nimittää näitä perinteisen psykoakustisen tutkimuksen parametreja äänen primitiivisiksi (fysikaalisiksi) ulottuvuuksiksi<sup id="ref-46_4" class="ref"><a href="#note-46" title="(Gaver 1993c, 1--2)">[46]</a></sup>. Schaeffer<sup id="ref-70_1" class="ref"><a href="#note-70" title="(Schaeffer (1967, 270)">[70]</a></sup> kutsuu tätä pelkistetyksi kuuntelemiseksi (reduced listening), koska siinä keskitytään ääneen itsessään, irrotettuna sen syystä ja merkityksestä<sup id="ref-33_15" class="ref"><a href="#note-33" title="(Chion 1990, 29)">[33]</a></sup>. Myös Chionin<sup id="ref-33_16" class="ref"><a href="#note-33" title="(Chion 1990, 31)">[33]</a></sup> mielestä äänellä on kausaalisuutensa lisäksi myös oma esteettinen arvonsa johtuen äänen väristä ja tekstuurista. Gaver<sup id="ref-46_5" class="ref"><a href="#note-46" title="(Gaver 1993c, 1--2)">[46]</a></sup> painottaa kuitenkin, että ero on kokemuksessa, ei äänissä. On siis hyvinkin mahdollista kuunnella myös jokapäiväistä äänimaisemaamme musiikkina. Gaver mainitsee tässä säveltäjä John Cagen, joka on hyödyntänyt tätä seikkaa sävellyksissään.<sup id="ref-46_6" class="ref"><a href="#note-46" title="(Gaver 1993c, 1--2)">[46]</a></sup>.</p>
<p>Gaverin mielestä jokapäiväisen kuuntelun tuottama informaatio voi toimia perustana uuden viitekehyksen luomisessa: voimme manipuloida ääntä sen äänilähteen ulottuvuuksien kautta, ei itse äänen ulottuvuuksien kautta<sup id="ref-46_7" class="ref"><a href="#note-46" title="(Gaver 1993c, 2)">[46]</a></sup>. Gaver vertailee ääniä seuraavalla tavalla: musiikilliset äänet eivät edusta päivittäin kuulemaamme äänimaisemaa, koska useimmat musiikilliset äänet ovat harmonisia, kun taas jokapäiväiset äänet eivät ole, sisältäen myös hälinää; musiikilliset äänet paljastavat vähemmän lähteistään kuin jokapäiväiset äänet; musiikillisilla instrumenteilla muutokset äänen korkeudessa tai voimakkuudessa (siis fyysisissä attribuuteissa) eivät ole niin informatiivisia kuin jokapäisten äänten tuottamat variaatiot.<sup id="ref-46_8" class="ref"><a href="#note-46" title="(Gaver 1993c, 3)">[46]</a></sup>. Tämä on mielenkiintoinen näkökulma, koska tällöin päästään tarkastelemaan aktiivisesti äänimaisemaa ajassa, eikä pelkästään passiivisesti &#8220;kivettynyttä&#8221; musiikillista ärsykettä. Gaverin erittely paljastaa, että perinteiset musiikilliset äänet edustavat vain muutamaa prosentin murto-osaa siitä mahdollisesta kapasiteetista, jonka jokapäiväinen ääniympäristömme joka hetki tuottaa.</p>
</div>
<div id="ch-2_6">
<h4>2.6 Syntaktiset ja semanttiset tekijät äänten tunnistamisessa <a title="takaisin sisällysluetteloon" href="#toc-2_6">^</a></h4>
<p>Käyttöliittymässä on tärkeää, että äänen merkitys on yksiselitteinen; tätä varten äänen on oltava tunnistettava. Kieli voidaan jakaa kolmeen tasoon: sanoihin (lexical level), kielioppiin/syntaksiin (syntactic level) ja semantiikkaan<sup id="ref-16_6" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 450)">[16]</a></sup>. Jos näitä tasoja sovelletaan ei-puheääniin, äänen fysikaaliset attribuutit (esimerkiksi spatiaalisuus) edustavat alinta tasoa &#8212; jolle suurin osa äänitutkimuksesta on keskittynyt<sup id="ref-16_7" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 450)">[16]</a></sup>. Ääniä voidaan prosessoida ylhäältä alas (top-down) tai alhaalta ylös (bottom-up). Howardin ja Ballaksen<sup id="ref-52_0" class="ref"><a href="#note-52" title="(Howard ja Ballas 1980, 431)">[52]</a></sup> mukaan ylhäältä alas prosessoiminen perustuu tietoon (knowledge-driven), kun taas alhaalta ylös dataan (data-driven). Esimerkiksi puheen havaitsemisessa kuuntelijat käyttävät sekä kielen syntaktista ja semanttista rakennetta että äänilähteestä tulevaa havainnollista informaatiota. Vähemmän on kuitenkin tutkittu syntaktisten ja semanttisten tekijöiden vaikutusta monimutkaisiin ei-puheääniin.<sup id="ref-52_1" class="ref"><a href="#note-52" title="(Howard ja Ballas 1980, 431)">[52]</a></sup>.</p>
<p>Alhaalta ylös prosessoitaessa havaitaan äänen akustisia ominaisuuksia, joista rakennetaan merkityksiä muistin avulla, kun taas ylhäältä alas prosessoitaessa tulkitaan äänen merkitys sen kontekstin ja aiempien kokemusten perusteella, josta edetään äänen yksittäisten parametrien analysointiin<sup id="ref-8_0" class="ref"><a href="#note-8" title="(Ballas &amp; Howard 1987, 96)">[8]</a></sup><sup id="ref-60_7" class="ref"><a href="#note-60" title="(Kramer 1994, 5)">[60]</a></sup><sup id="ref-49_5" class="ref"><a href="#note-49" title="(Goldstein 1999, 376)">[49]</a></sup><sup id="ref-4_0" class="ref"><a href="#note-4" title="(Anderson 2000, 63)">[4]</a></sup>.</p>
<p>Monilla jokapäiväisillä monimutkaisilla ei-puheäänillä on määriteltävissä oleva jaksollinen rakenne (siis syntaksi kielen tavoin), samoin kuin semanttinen sisältö, ja ne havaitaan samanlaisten prosessien kautta kuin puhe<sup id="ref-52_2" class="ref"><a href="#note-52" title="(Howard &amp; Ballas 1980, 431)">[52]</a></sup><sup id="ref-62_1" class="ref"><a href="#note-62" title="(Mansur ym. 1985, 117)">[62]</a></sup><sup id="ref-8_1" class="ref"><a href="#note-8" title="(Ballas &amp; Howard 1987, 96)">[8]</a></sup><sup id="ref-16_8" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 448)">[16]</a></sup>. Erojakin toki on: kieli viittaa sosiaalisiin merkityksiin, kun taas ympäristön ei-puheäänet viittaavat kausaalisiin tapahtumiin (sidottu akustiikan fysikaalisiin lakeihin)<sup id="ref-48_14" class="ref"><a href="#note-48" title="(Gibson 1966, 91)">[48]</a></sup><sup id="ref-8_2" class="ref"><a href="#note-8" title="(Ballas &amp; Howard 1987, 98)">[8]</a></sup>. Esimerkiksi oven avaaminen ja henkilön astuminen huoneeseen muodostavat jakson ajallisesti järjestettyjä äänitapahtumia. Tällaisilla jaksoilla on tilapäinen rakenne, koska ne koostuvat yksittäisistä äänitapahtumista, jotka syntyvät äänilähteiden sanelemassa järjestyksessä ja joilla on äänilähteistä riippuva kesto.<sup id="ref-52_3" class="ref"><a href="#note-52" title="(Howard &amp; Ballas 1980, 431)">[52]</a></sup>.</p>
<p>Myös Deutschin<sup id="ref-37_0" class="ref"><a href="#note-37" title="(Deutsch 1980, 381)">[37]</a></sup> tutkimus tukee tätä näkemystä rakenteen merkityksestä: voimme prosessoida monimutkaistakin informaatiota sarjallisesti, jos informaatio on systemaattisesti organisoitu ja havaitsija ymmärtää sen rakenteen. Ryhmittelemme sarjallisia kuvioita jaksoihin, joita sitten järjestelemme hierarkioihin. Esimerkiksi kielessä merkityksellisen lauseen muodostavat sanat havaitaan ja muistetaan paremmin kuin vain sanat sattumanvaraisessa järjestyksessä.<sup id="ref-37_1" class="ref"><a href="#note-37" title="(Deutsch 1980, 381)">[37]</a></sup>. Tämä seikka on keskeinen sijoitettaessa ääniä käyttöliittymän toimintoihin.</p>
<p>Ei-puheäänten kohdalla syntaksi syntyy niistä mahdollisista väliaikaisista suhteista, joista sarja äänitapahtumia voi keskenään muodostaa järkevän kokonaisuuden (esimerkiksi a&#8211;a&#8211;c&#8211;d&#8211;d)<sup id="ref-52_4" class="ref"><a href="#note-52" title="Howard &amp; Ballas 1980, 436">[52]</a></sup>. Howardin ja Ballaksen<sup id="ref-52_5" class="ref"><a href="#note-52" title="Howard &amp; Ballas 1980, 436, 438">[52]</a></sup> mukaan tämän kokonaisuuden on oltava sekä syntaktisesti että semanttisesti järkevä: syntaksin täytyy pohjautua äänitapahtumien väliaikaiseen rakenteeseen, ja yksittäisten äänitapahtumien täytyy noudattaa syntaksia. Muutoin kuuntelijoilla on vaikeuksia havaita rakennetta.<sup id="ref-52_6" class="ref"><a href="#note-52" title="Howard &amp; Ballas 1980, 436, 438">[52]</a></sup>. Tätä seikkaa voidaan hyödyntää jakamalla käyttöliittymän toiminnot äänitapahtumien jaksoiksi: jakso koostuu toiminnoista, jotka käyttäjä tekee suorittaakseen jonkin tehtävän.</p>
<p>Warrenin ja Verbruggen<sup id="ref-78_0" class="ref"><a href="#note-78" title="(Warren ja Verbrugge 1984)">[78]</a></sup> tavoitteena oli löytää ne tekijät, joiden perusteella kuuntelija tunnistaa eri vuorovaikutuksen muodon. He tutkivat kahta eri tapausta, pullon särkymistä ja pomppimista kovalla alustalla, ja huomasivat, että spektraaliset erot eivät olleet ratkaisevia tunnistamisessa. Kuuntelijat kykenevät erottamaan pullon pomppimisen ja särkymisen toisistaan vain niiden ajallisten jaksojen perusteella.<sup id="ref-78_1" class="ref"><a href="#note-78" title="(Warren ja Verbrugge 1984, 711)">[78]</a></sup>. Tämä tutkimus on keskeinen, koska se vahvistaa edellä käsiteltyä näkemystä äänitapahtumien väliaikaisen rakenteen merkityksestä. Pomppiva pullo aiheuttaa erilaisen väliaikaisen jakson äänitapahtumia (tässä tapauksessa iskuja) kuin särkyvä pullo. Kuuntelijat reagoivat rytmiin halukkaammin kuin mihinkään muuhun äänen parametriin<sup class="ref"><a href="#4" title="(Blattner, Sumikawa &amp; Greenberg 1989, 23)">[4]</a></sup>. Luultavasti tästä syystä väliaikaisen rakenteen merkitys on niin ratkaiseva tunnistamisessa.</p>
<p>Voimme käyttää myös kontekstia apuna objektien tunnistamisessa ja merkityksenannossa<sup id="ref-8_3" class="ref"><a href="#note-8" title="(Ballas &amp; Howard 1987, 98)">[8]</a></sup><sup id="ref-9" class="ref"><a href="#note-9" title="(Ballas &amp; Mullins 1991)">[9]</a></sup><sup id="ref-4_1" class="ref"><a href="#note-4" title="(Anderson 2000, 63)">[4]</a></sup>. Usein hyvinkin erilaiset fysikaaliset tapahtumat aiheuttavat samankaltaisia ääniä<sup id="ref-16_9" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 450)">[16]</a></sup>. Schafer<sup id="ref-71_5" class="ref"><a href="#note-71" title="(Schafer 1977, 150)">[71]</a></sup> ottaa esimerkin: käärmeen sihinä ja kattilan kiehuminen ovat äänenä lähellä toisiaan, mutta herättävät eri kontekstissa erilaisen kokemuksen. Kun nämä kaksi ääntä irroitetaan kontekstistaan ja toistetaan nauhalta, niiden identiteetti hämärtyy. Korva ei ole tarpeeksi tarkka erottamaan näiden kahden äänen fysikaalisia eroja erottaakseen käärmeen sihinän ja veden kiehumisen toisistaan nauhalta.<sup id="ref-71_6" class="ref"><a href="#note-71" title="(Schafer 1977, 150)">[71]</a></sup>. Toisena esimerkkinä voisi olla ääni &#8220;klik-klik&#8221;: tällainen ääni voi kuulua kuulakärkikynästä, valokatkaisijasta, nitojasta tai kamerasta. Ainoastaan konteksti voi poistaa epäilyksen siitä, mistä on kyse. Ballas<sup id="ref-6_0" class="ref"><a href="#note-6" title="(Ballas 1993)">[6]</a></sup> arvioi akustisia, ekologisia, havainnollisia ja kognitiivisia tekijöitä, jotka ovat keskeisiä jokapäiväisten äänten tunnistamisessa. Tutkimuksessa oli mukana 41 lyhyttä ja toisistaan eroavaa jokapäiväistä ääntä. Tutkimus osoitti, että äänilähteen tunnistamiseen vaikuttavat ainakin akustiset (fysikaaliset) muuttujat, ekologinen frekvenssi, kausaalinen epävarmuus ja äänen tyypillisyys<sup id="ref-6_1" class="ref"><a href="#note-6" title="(Ballas 1993, 262)">[6]</a></sup>. Tutut äänet siis tunnistetaan nopeammin<sup id="ref-8_4" class="ref"><a href="#note-8" title="(Ballas &amp; Howard 1987, 103)">[8]</a></sup><sup id="ref-6_2" class="ref"><a href="#note-6" title="(Ballas 1993, 256)">[6]</a></sup>.</p>
<p>Edellä on alustavasti käsitelty äänten havaitsemiseen ja äänilähteiden tunnistamiseen liittyviä asioita. Luvun lopuksi on tarpeen koota keskeiset huomiot. Kuulohavaintojärjestelmän ansiosta voimme aktiivisesti suuntautua äänivirtaa kohti, kohdistaa katseemme tähän objektiin sekä tunnistaa sen joko kuulo- tai näköaistimme avulla. Jokapäiväiset äänet voivat välittää hienovaraisempaa informaatiota äänilähteestä kuin (perinteisten) musiikillisten instrumenttien tuottamat äänet. Kuuloaistilla tunnistettaessa on varmistettava, että äänitapahtumien sarja noudattaa syntaksia: tällöin äänitapahtumien muodostama kokonaisuus on semanttisesti looginen ja ymmärrettävä.</p>
<p>Anderson<sup id="ref-4_2" class="ref-4_2"><a href="#note-4" title="(Anderson 2000, 81)">[4]</a></sup> summaa luvun vielä seuraavasti: valitsemme äänen, johon suuntaudumme, äänen fysikaalisten ominaisuuksien perusteella (esimerkiksi korkeuden perusteella), jolloin &#8220;voimistamme&#8221; kyseistä ääntä ja vaimennamme muut äänet. Nämä muut äänet eivät kuitenkaan kokonaan vaimennu, vaan kiinnittävät huomiomme jos ne ovat fyysisiltä ominaisuuksiltaan korostavia (esimerkiksi kova ääni), semanttiselta sisällöltään kiintoisia (jos nimemme mainitaan) tai yhteneväisiä sillä hetkellä prosessoimamme äänen kanssa.<sup id="ref-4_3" class="ref"><a href="#note-4" title="(Anderson 2000, 81)">[4]</a></sup>. <a title="Luku 3" href="#ch-3">Seuraavassa luvussa</a> keskitytään tarkemmin yhteen äänen parametreista. Spatiaaliset jokapäiväiset äänet toimivat analogiana kielen sanoihin ja voivat muodostaa syntaksin &#8212; ja siten merkityksen &#8212; käyttöliittymäkontekstissa.</p>
</div>
<div id="ch-3">
<h3>3. Spatiaalinen ääni <a title="takaisin sisällysluetteloon" href="#toc-3">^</a></h3>
<p><span class="drop">Ä</span><span class="lead-in">äni välittää informaatiota</span> äänilähteen ja ympäristön lisäksi myös sijainnista<sup id="ref-46_9" class="ref"><a href="#note-46" title="(Gaver 1993c, 7)">[46]</a></sup>. Visuaalisen näkyvyyden heiketessä &#8212; esimerkiksi huonon valaistuksen vuoksi &#8212; täytyy turvautua spatiaaliseen äänimaisemaan<sup id="ref-49_6" class="ref"><a href="#note-49" title="(Goldstein 1999, 242)">[49]</a></sup>. Samassa tilanteessa ollaan myös silloin, kun näyttö on liian täynnä visuaalista informaatiota. Kuten <a title="Luku 2" href="#ch-2">edellisessä luvussa</a> todettiin, kuuntelija voi erottaa äänivirtoja myös yhdestä kaiuttimesta. Ääniä ryhmitellään siis myös muiden muuttujien kuin sijainnin perusteella. Onko spatiaalisen äänen funktio siten vain immersiivisyyden lisääminen tai navigointi tilassa? Tässä luvussa tarkastellaan spatiaalista ääntä ja pyritään löytämään tapoja sen hyödyntämiseen käyttöliittymässä. Jokapäiväisen spatiaalisen äänimaisemamme hyödyntäminen käyttöliittymässä voi parhaimmillaan johtaa intuitiiviseen vuorovaikutukseen.</p>
<p>Spatiaalisuus pitää sisällään useita tekstuureita: <em>polyfonia</em> muodostuu kahdesta tai useammasta samanaikaisesta, yhtä tärkeästä melodiasta; <em>homofonia</em> taas yhdestä päämelodiasta ja useista muista, säestävistä melodioista<sup id="ref-15" class="ref"><a href="#note-15" title="(Blattner, Greenberg &amp; Kamegai 1992, 101)">[15]</a></sup>. Käyttöliittymän kokonaisäänimaisema voisi siten muodostua polyfonisista äänivirroista sijoiteltuna spatiaalisesti. Äänimaisema voisi osin olla myös homofoninen, riippuen äänten tärkeydestä ja luokittelusta käyttöliittymän eri konteksteissa. Ennen spatiaalisen äänen tarkempaa määrittelyä on tarpeen käsitellä niitä tekijöitä, joiden perusteella ääni paikannetaan tietystä suunnasta tulevaksi. Luvussa pohditaan myös spatialisoinnin toteutukseen liittyviä ongelmia ja esitellään spatiaalista ääntä hyödyntäviä sovelluksia. Spatialisointia ja auralisaatiota voidaan tämän jälkeen tarkastella semioottisessa viitekehyksessä kuuntelijan näkökulmasta <a title="Luku 4" href="#ch-4">luvussa 4</a>.</p>
</div>
<div id="ch-3_1">
<h4>3.1 Äänen paikantaminen <a title="takaisin sisällysluetteloon" href="#toc-3_1">^</a></h4>
<p>Jauhiainen<sup id="ref-54_15" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 150)">[54]</a></sup> määrittelee <em>lokalisaation</em> äänen paikantamiseksi ilman kuulokkeita ja <em>lateralisaation</em> äänen paikantamiseksi kuulokkeita käyttämällä.  Lateralisaatio viittaa äänen paikantumiseen sivuun keskipisteestä, eli sijoittumista keskipisteestä jompaan kumpaan korvaan<sup id="ref-54_16" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 150)">[54]</a></sup>. Seuraavassa tarkastellaan niitä tekijöitä, joiden perusteella ääni paikannetaan tietystä suunnasta tulevaksi.</p>
<p>Vaihe-ero korvien välillä (interaural delay time, IDT) on merkittävä tekijä paikantamisessa<sup id="ref-29_0" class="ref"><a href="#note-29" title="(Burgess 1992b, 54)">[29]</a></sup>. Vaihe tarkoittaa värähtelyn ajankohtaa tiettynä hetkenä. Jos viivettä ei ole, ääni tulee suoraan edestä, takaa tai yläpuolelta. Jos ääni tulee sivulta, ääniaallot tulevat perille eri aikaan eri korvaan. Viive voi enimmillään olla 0.63 millisekuntia, jonka aikana ääni kulkee pään läpimitan pituisen matkan.<sup id="ref-29_1" class="ref"><a href="#note-29" title="(Burgess 1992b, 54)">[29]</a></sup>. Äänen voimakkuusero korvien välillä (interaural intensity difference, IID) on toinen merkittävä tekijä äänen paikantamisessa<sup id="ref-57_1" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>.</p>
<p>Jos ääni tulee sivusta, sen täytyy ennen toiseen korvaan etenemistään kiertää ensin pään ympäri. Pää imee itseensä osan ääniaalloista, joten alkuperäinen ääni tulee toiseen korvaan hieman vaimennettuna. Tätä ilmiötä kutsutaan pään aiheuttamaksi äänen vaimenemiseksi (head shadow effect).<sup id="ref-29_2" class="ref"><a href="#note-29" title="(Burgess 1992b, 54)">[29]</a></sup>. Samoin äänen tullessa takaa korvalehdet vaimentavat ääntä hieman verrattuna siihen, että ääni tulisi edestä<sup id="ref-50_1" class="ref"><a href="#note-50" title="(Goose &amp; Möller 1999, 365)">[50]</a></sup>. Alle 1500 Hz:n taajuiset ääniaallot ovat jo niin pitkiä, että ne taipuvat pään ympäri, jolloin voimakkuuseroa on vaikea havaita; paikantaminen tapahtuu tällöin pääasiassa vaihe-eron perusteella. Yli 1500 Hz:n taajuudet taas heijastuvat poispäin ja vaimentuvat pään vaikutuksesta, jolloin paikantaminen tehdään pääasiassa voimakkuuseron mukaan. 1500 Hz:n raja johtuu siitä, että 1500 Hz:n ääniaallon aallonpituus on sama kuin pään läpimitta.<sup id="ref-57_2" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Havaitsemme äänen sijainnin sivusuunnassa siis sekä vaihe- että voimakkuuseron perusteella.</p>
<p>Korvalehden ja -käytävän  merkitys (pinna and ear canal response) äänen paikantamisessa on kaksikorvaisuuden ohella ratkaiseva. Koska jo vaihe- ja voimakkuuseron perusteella paikannamme ääniä vaaka-akselilla, korvalehtiä tarvitaan oikeastaan vain äänten paikantamiseen pystyakselilla. Tämän lisäksi korvalehtiä tarvitaan luomaan vaikutelma siitä, että ääni todellakin tulee pään ulkopuolelta eikä sisältä. Korvalehdet ohjaavat äänen korvakäytävään, mutta samalla korvalehtien epäsäännöllinen muoto muuttaa äänen spektriä vaimentamalla ja voimistamalla tiettyjä taajuuksia äänen tulosuunnan ja kunkin ihmisen yksilöllisen anatomian mukaan. Tämän jälkeen aivot vertaavat ja tulkitsevat saatua tietoa äänen paikantamiseksi.<sup id="ref-57_3" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>.</p>
<p>Ihmisen yläruumis ja olkapäät heijastavat tiettyjä taajuuksia (shoulder echoes). Nämä heijastukset saapuvat korviin hieman myöhemmin riippuen äänen tulokulmasta. Myös tämä informaatio auttaa äänen tulosuunnan havainnoimisessa.<sup id="ref-29_3" class="ref"><a href="#note-29" title="(Burgess 1992b, 54)">[29]</a></sup>. On luonnollista, että käännämme päätämme halutessaan tarkemmin selvittää äänen suunnan. Jos käännämme päätämme sivulta tulevaa ääntä kohden, koemme äänen nyt tulevan keskeltä. Pään liikkeen avulla on siis mahdollista paikantaa ääni tarkemmin. Wun, Duhin, Ouhyoungin ja Wun<sup id="ref-83_0" class="ref"><a href="#note-83" title="(Wu, Duh, Ouhyoung ja Wu 1997, 17)">[83]</a></sup> tutkimuksen mukaan pään kääntäminen äänen suuntaan parantaa paikantamista 90 % verrattuna pään pitämiseen paikallaan. Esimerkiksi jos ääni tulee etuoikealta, vaihe- ja voimakkuuserot ovat samat, jolloin äänilähde voisi teoriassa olla &#8220;peilikuvaäänenä&#8221; myös takaoikealla<sup id="ref-12_0" class="ref"><a href="#note-12" title="(Begault 1991, 866)">[12]</a></sup>. Tilanne aiheuttaa epätietoisuutta, jos pää pidetään paikallaan. Pään kääntäminen oikealle poistaa heti peilikuvaäänen vaihe- ja voimakkuuserojen muuttuessa. Tällöin häviää epätietoisuus siitä, tuleeko ääni edestä vai takaa.</p>
<p>Myös näköaisti vaikuttaa paikantamiseen, joskin yllättävällä tavalla. Hylkäämme kuuloaistin tuoman informaation, jos se on ristiriidassa näkemämme äänilähteen sijainnin kanssa<sup id="ref-29_4" class="ref"><a href="#note-29" title="(Burgess 1992b, 55)">[29]</a></sup><sup id="ref-49_7" class="ref"><a href="#note-49" title="(Goldstein 1999, 242)">[49]</a></sup>. Uskomme siis mieluummin näkö- kuin kuuloaistia.</p>
<p>Huopaniemen<sup id="ref-53_1" class="ref"><a href="#note-53" title="(Huopaniemi 1999, 34)">[53]</a></sup> mukaan <em>huonekaiku</em> (room impulse response, RIR) voidaan jakaa suoraan ääneen, ensiheijastumiin ja jälkikaiuntaan. <em>Suora ääni</em> on ääni, joka saapuu korvaan suoraan heijastumatta ensin mistään pinnasta. <em>Ensiheijastumat</em> (early echo response) ovat ääniä, jotka saapuvat kuulijan korvaan 50&#8211;100 millisekunnin kuluessa äänen syntymisestä<sup id="ref-29_5" class="ref"><a href="#note-29" title="(Burgess 1992b, 55)">[29]</a></sup>. Binauraalinen (kaksikanavainen) huonekaiku (binaural room impulse response, BRIR) riippuu kuulijan ja äänilähteen sijainnista sekä huoneen ominaisuuksista tietyllä hetkellä<sup id="ref-58_0" class="ref"><a href="#note-58" title="(Kleiner, Dalenbeck &amp; Svensson 1993, 865)">[58]</a></sup>.</p>
<p><em>Jälkikaiunta</em> tarkoittaa ensiheijastuman jälkeisiä äänen heijastuksia. Huoneen kaikuisuutta mitataan jälkikaiunta-aikana (reverberation time), jota mitataan voimakkaalla lyhyellä äänipulssilla. Jauhiaisen<sup id="ref-54_17" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 38)">[54]</a></sup> mukaan jälkikaiunta-aika on aika, joka kuluu äänitason pienenemiseen 60 dB:iin käytetyn äänipulssin huippuarvosta. Suora ääni tulee ensimmäisenä suoraan kuulijan korvaan, ja kaikki ensi- ja jälkiheijastumat saapuvat tämän jälkeen eri aikoihin ja eri suunnista. Suoran äänen perusteella saamme vihjeitä äänilähteen suunnasta ja heijastumien määrän sekä äänen voimakkuuden perusteella äänen etäisyydestä ja tilan ominaisuuksista.<sup id="ref-29_6" class="ref"><a href="#note-29" title="(Burgess 1992b, 57)">[29]</a></sup><sup id="ref-57_4" class="ref"><a href="#note-4" title="(Kendall 1995)">[57]</a></sup><sup id="ref-63_0" class="ref"><a href="#note-63" title="(McGrath 1995, 1--2)">[63]</a></sup>.</p>
<p>Äänilähteen liikkuessa sen suunta ja etäisyys muuttuvat. <em>Doppler-ilmiö</em> (doppler-effect) syntyy, kun kohteen lähestyessä ääniaallot tihentyvät, jolloin aallonpituus lyhenee ja äänen korkeus nousee. Vastaavasti kohteen loitontuessa ääniaallot harventuvat, jolloin äänen korkeus laskee. Tästä voimme päätellä, että äänilähde liikkuu. Mitä nopeammin äänilähde liikkuu suoraan meitä kohti tai meistä poispäin lähietäisyydellä, sitä suurempi on äänen korkeuden muutos. Näin voimme saada tietoa äänilähteen etäisyydestä ja suunnasta.<sup id="ref-71_7" class="ref"><a href="#note-71" title="(Schafer 1977, 80)">[71]</a></sup><sup id="ref-13_1" class="ref"><a href="#note-13" title="(Begault 1994, 40)">[13]</a></sup>.</p>
<p>Äänen paikantamiseen vaikuttavat siis vaihe- ja voimakkuuserot korvien välillä, pään aiheuttama äänen vaimeneminen, korvalehden ja korvakäytävän muoto, heijastumat olkapäistä ja yläruumiista, pään liike, näköaisti, suora ääni, ensiheijastumat, jälkikaiunta-aika, äänilähteen liikkuminen ja Dopplerin ilmiö. Näiden tekijöiden vaikutukset äänen spektriin ovat mitattavissa siirtofunktion avulla. Siirtofunktion määrittelemisen jälkeen esitetään menetelmä, jolla ääneen lisätään keinotekoisesti vihjeitä tilasta ja suunnasta.</p>
</div>
<div id="ch-3_2">
<h4>3.2 Siirtofunktio <a title="takaisin sisällysluetteloon" href="#toc-3_2">^</a></h4>
<p>Begaultin<sup id="ref-12_1" class="ref"><a href="#note-12" title="(Begault 1991, 864)">[12]</a></sup> mukaan <em>siirtofunktion</em> (head related transfer function, HRTF) avulla saadaan selville, miten äänen spektri muuttuu äänen kulkiessa pään ulkopuolisesta äänilähteestä ulkokorvan läpi tärykalvolle. Siirtofunktio on erilainen kummassakin korvassa, ja se määritetään mittaamalla tärykalvoon saapuvan äänen spektrin muutokset verrattuna äänilähteestä lähtevän äänen spektriin. Tällöin voidaan tietokoneen avulla laskea alkuperäisen signaalin ja koehenkilön korviin tulevan signaalin perusteella kyseisen henkilön siirtofunktiot kunkin äänilähteen suhteen. Siirtofunktio vaihtelee äänilähteen sijainnin ja kuulijan pään asennon välisen suhteen mukaan kullakin hetkellä.<sup id="ref-12_2" class="ref"><a href="#note-12" title="(Begault 1991, 864)">[12]</a></sup><sup id="ref-57_5" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>.</p>
<p>Aina ei ole mahdollista mitata jokaisen yksilöllisen käyttäjän siirtofunktioita. Myös yleisen, keskiarvoisen siirtofunktion avulla päästään todentuntuisiin tuloksiin paikantamisessa (parhaiten kuitenkin vaaka-akselilla)<sup id="ref-12_3" class="ref"><a href="#note-12" title="(Begault 1991, 865)">[12]</a></sup><sup id="ref-81_0" class="ref"><a href="#note-81" title="(Wenzel, Wightman &amp; Kistler 1991, 358)">[81]</a></sup><sup id="ref-50_2" class="ref"><a href="#note-50" title="(Goose &amp; Möller 1999, 365)">[50]</a></sup>. Keskiarvoinen siirtofunktio on määritetty mittaamalla se suurelta määrältä ihmisiä ja laskemalla keskiarvo. Toinen mahdollisuus on käyttää keskimääräistä paremman &#8220;paikantajan&#8221; siirtofunktiota<sup id="ref-12_4" class="ref"><a href="#note-12" title="(Begault 1991, 865)">[12]</a></sup>. Mittaukset tehdään yleensä kaiuttomassa huoneessa eri suunnista tulevilla äänillä laajalla taajuusalueella<sup id="ref-63_1" class="ref"><a href="#note-63" title="(McGrath 1995, 3)">[63]</a></sup>.</p>
</div>
<div id="ch-3_3">
<h4>3.3 Äänen synteettinen spatialisointi <a title="takaisin sisällysluetteloon" href="#toc-3_3">^</a></h4>
<p><em>Spatialisointi</em> tarkoittaa Goosen ja Möllerin<sup id="ref-50_3" class="ref"><a href="#note-50" title="(Goose ja Möller 1999, 363)">[50]</a></sup> mukaan äänen prosessointia siten, että ääni koetaan tulevan kolmiulotteisesta äänikentästä (tietystä tunnistettavasta suunnasta) kuulijan ulkopuolelta. Burgessin<sup id="ref-28_0" class="ref"><a href="#note-28" title="(Burgess 1992a, 2)">[28]</a></sup><sup id="ref-29_7" class="ref"><a href="#note-29" title="(1992b, 53)">[29]</a></sup> mukaan digitaalinen monauraalinen ääni voidaan keinotekoisesti spatialisoida binauraaliseksi ääneksi digitaalisten suodatinalgoritmien avulla, kun tiedetään joko yksilöllinen tai keskiarvoinen siirtofunktio. Tätä kutsutaan synteettiseksi spatialisoinniksi.</p>
<p>Sekä stereoääni että binauraalinen ääni viittaavat kahden kanavan käyttöön, mutta poikkeavat äänitystekniikoiltaan ja äänentoisto-ominaisuuksiltaan toisistaan (monauraalinen viittaa yhden kanavan käyttöön). Burgessin<sup id="ref-28_1" class="ref"><a href="#note-28" title="(Burgess 1992a, 1)">[28]</a></sup><sup id="ref-29_8" class="ref"><a href="#note-29" title="(1992b, 53)">[29]</a></sup> mukaan stereoäänitys tarkoittaa monilla toisistaan erossa olevilla mikrofoneilla tehtyä äänitystä, jota kuunnellessaan kuulija voi havaita äänilähteen sijainnin äänikentässä. Tällöin sijainti on kuitenkin rajoitettu siihen vaakasuoraan linjaan, joka muodostuu kahden kaiuttimen välille tai kuulijan vasemman ja oikean korvan välille kuulokkeilla kuunneltaessa (ääni ei siis tunnu kuuluvan riittävästi pään ulkopuolelta)<sup id="ref-57_6" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Stereoäänitys ei kaksiulotteisena vastaa reaalitodellisuudessa korviimme tulevaa ääntä, koska se sisältää vain alkeellisen syvyysvaikutelman (lähellä&#8211;kaukana) ja leveysvaikutelman (vasen&#8211;oikea). Kolmiulotteinen ääni (three-dimensional sound) luo illuusion syvyyden ja leveyden lisäksi myös korkeudesta.</p>
<p>Kuulija voi siis paikantaa ääniä kaikista suunnista oman päänsä ulkopuolelta, myös edestä ja takaa<sup id="ref-83_1" class="ref"><a href="#note-83" title="(Wu ym. 1997, 16)">[83]</a></sup>. Olemme jatkuvasti tällaisen akustisen kolmiulotteisen äänikentän ympäröimänä. Binauraalinen äänitys ei ole sidottu vertikaaliseen linjaan (toisin kuin stereossa), vaan äänet tuntuvat tulevan tietystä paikasta pään ulkopuolelta. Binauraalinen äänitys kuulostaa realistisemmalta kuin stereoäänitys. Binauraalinen ääni voidaan Jot&#8217;n<sup id="ref-56_0" class="ref"><a href="#note-56" title="(Jot 1997, 56)">[56]</a></sup> mukaan toteuttaa kahdella tavalla: (a) äänittämällä äänitapahtuma omassa akustisessa ympäristössään tai (b) syntetisoimalla virtuaalinen äänitapahtuma. KUVIOSSA 2 on havainnollistettu binauraalisen äänen nauhoitusta ja toistoa (kohta (a))<sup id="ref-63_2" class="ref"><a href="#note-63" title="(McGrath 1995, 3)">[63]</a></sup>, ja KUVIOSSA 3 siirtofunktioiden mittausta ja simulointia (kohta (b))<sup id="ref-63_3" class="ref"><a href="#note-63" title="(McGrath 1995, 3)">[63]</a></sup>.</p>
<p><img id="figure-2" src="http://www.akikoo.org/wp-content/themes/aksu/images/bin_rec.png" alt="Binauraalinen äänitys ja toisto" /></p>
<h5>KUVIO 2. Binauraalinen äänitys ja toisto <a title="takaisin sisällysluetteloon" href="#toc-figure_2">^</a></h5>
<p>Ensiksi mainitussa tapauksessa äänitys tehdään joko lähimikityksellä tai keinopään (dummy head, artificial head) tai koehenkilön korvakäytäviin asennetuilla mikrofoneilla. Tällöin äänitapahtuma sisältää sekä paikantamiseen että huonekaikuun liittyvät elementit. Menettely kuitenkin hankaloittaa äänen jälkikäsittelyä. Kun taas äänitapahtuma on synteettinen, paikantamiseen ja tilan akustisiin ominaisuuksiin liittyvät parametrit lisätään ääneen signaalinprosessoinnin avulla keinotekoisesti, äänittämisen jälkeen siirtofunktion avulla<sup id="ref-57_7" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Äänen binauraalisen käsittelyn avulla voidaan siis luoda kolmiulotteinen äänikenttä kahden kanavan avulla<sup id="ref-56_1" class="ref"><a href="#note-56" title="(Jot 1997, 60)">[56]</a></sup>.</p>
<p><img id="figure-3" src="http://www.akikoo.org/wp-content/themes/aksu/images/hrtf.png" alt="Siirtofunktioiden  mittaus ja simulointi" /></p>
<h5>KUVIO 3. Siirtofunktioiden  mittaus ja simulointi <a title="takaisin sisällysluetteloon" href="#toc-figure_3">^</a></h5>
<p>Burgess<sup id="ref-29_9" class="ref"><a href="#note-29" title="(Burgess 1992b, 55)">[29]</a></sup> kuvaa spatialisointiprosessia seuraavassa esitettävällä tavalla: Kutakin äänilähteen koordinaattia pysty- ja vaakatasolla vastaa yksi siirtofunktio-suodatinpari kumpaakin korvaa varten. Jotta kuulija voi sijoittaa äänen tiettyyn paikkaan äänikentässä, kyseinen ääni on prosessoitava vastaavalla suodatinparilla. Burgess<sup id="ref-29_10" class="ref"><a href="#note-29" title="(Burgess 1992b, 55)">[29]</a></sup> esittää <em>silmukka-algoritmin äänten reaaliaikaiselle spatialisoinnille:</em></p>
<p>Prosessi 1:</p>
<ul>
<li>päivitä äänen sijainti</li>
<li>hanki halutut vaaka- ja pystykoordinaatit</li>
<li>etsi lähimmät siirtofunktio-suodatinparit</li>
<li>hanki haluttu suodatinpari</li>
<li>lähetä suodatinpari prosessi 2:seen</li>
</ul>
<p>Prosessi 2:</p>
<ul>
<li>käytä suodatinta</li>
<li>jaa monauraalinen lähdesignaali binauraaliseksi</li>
<li>lisää vasen  ja oikea suodatin signaaleihin</li>
<li>konvertoi äänikanavat analogisiksi ja soita ääni</li>
<li>korvaa nykyinen suodatinpari uudella (takaisin prosessiin 1)</li>
</ul>
<p>Burgessin<sup id="ref-29_11" class="ref"><a href="#note-29" title="(Burgess 1992b, 53)">[29]</a></sup> mukaan uudet digitaaliset signaaliprosessorit mahdollistavat jo reaaliaikaisen spatialisoinnin. Prosessissa 2 jokainen yksittäinen monauraalinen ääni siis jaetaan oikealle ja vasemmalle kanavalle, jonka jälkeen saadut stereoparit prosessoidaan halutulla suodattimella. Lopuksi kaikki valmiit stereoparit summataan yhdeksi stereotulosteeksi, joka toistetaan joko kuulokkeilla tai kaiuttimilla. Prosessi vaatii koneelta erittäin paljon laskutehoa, varsinkin jos tarkoituksena on luoda monipuolinen useista yksittäisistä äänilähteistä muodostunut kolmiulotteinen äänikenttä.</p>
<p>Alten<sup id="ref-3" class="ref"><a href="#note-3" title="(Alten 1999, 417)">[3]</a></sup> mainitsee stereoäänen ja kolmiulotteisen (binauraalisen) äänen lisäksi vielä <em>surround-äänen</em> menetelmänä luoda spatiaalinen äänikenttä. Kolmiulotteinen surround-ääni saadaan aikaan sijoittamalla kaiuttimia eri puolille kuulijaa. Tällaiseen monikaiutinjärjestelmään ei kuitenkaan tässä tutkimuksessa puututa, vaan spatialisoidun äänen toisto rajoitetaan tapahtuvaksi kuulokkeilla tai vaihtoehtoisesti kahdella kaiuttimella (ks. <a title="kohta 3.5" href="#ch-3_5">kohta 3.5</a>). Spatialisointi on siis menettelytapa, jolla luodaan kolmiulotteinen äänikenttä, josta voidaan erottaa ja paikantaa äänilähteitä eri suunnissa. Kun äänet on spatialisoitu, kuulija voi erottaa äänikentästä eri lähteitä, keskittyä niihin ja sivuuttaa muut.</p>
<p>Asia erikseen on &#8220;mentaalinen&#8221; spatialisaatio. Chionin<sup id="ref-33_17" class="ref"><a href="#note-33" title="(Chion 1990, 69)">[33]</a></sup> mukaan perinteisessä monauraalisessa elokuvassa sijainti, josta ääni fyysisesti tulee, ei ole sama kuin mistä se koetaan tulevan. Esimerkiksi jos henkilö elokuvassa kävelee ruudun halki, askeleet koetaan kuuluvan ja seuraavan henkilöä, vaikka ne todellisuudessa kuuluvat samasta staattisesta kaiuttimesta.<sup id="ref-33_18" class="ref"><a href="#note-33" title="(Chion 1990, 69)">[33]</a></sup>. Tällöin spatiaalisuus koetaan äänen ja kuvan yhteisvaikutuksena mielen tasolla, ei fyysisesti (ks. audiovisuaalinen sopimus, <a title="kohta 2.4" href="#ch-2_4">kohta 2.4</a>).</p>
</div>
<div id="ch-3_4">
<h4>3.4 Auralisaatio  <a title="takaisin sisällysluetteloon" href="#toc-3_4">^</a></h4>
<p><em>Auralisaatio</em> on visualisaation vastine kuuloaistin alueella<sup id="ref-63_4" class="ref"><a href="#note-63" title="(McGrath 1995, 1)">[63]</a></sup>. Begaultin<sup id="ref-13_2" class="ref"><a href="#note-13" title="(Begault 1994, 145)">[13]</a></sup> mukaan auralisaatiossa luodaan jokin akustinen virtuaalitila huonekaiun mallintamisen ja synteettisen spatialisoinnin avulla. Siirtofunktio-suodattimilla prosessoidaan sekä suora ääni että heijastuneet äänet. Kendallin<sup id="ref-57_8" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup> mukaan etäisyys- ja tilavaikutelma luodaan ääneen kontrolloimalla ensiheijastumien ja jälkikaiunnan määrää. Kleiner ym.<sup id="ref-58_1" class="ref"><a href="#note-58" title="(Kleiner ym. 1993, 861)">[58]</a></sup> ovat määritelleet auralisaation seuraavasti:</p>
<blockquote>
<p class="quote">Auralization is the process of rendering audible, by physical or mathematical modeling, the sound field of a source in a space, in such a way as to simulate the binaural listening experience at a given position in the modeled space.</p>
<p class="author">Kleiner ym. (1993, 861)</p>
</blockquote>
<p>Tavoitteena auralisaatiossa on siis luoda vaikutelma jonkin tilan akustisista ominaispiirteistä, siihen liittyvistä äänistä sekä niiden sijainnista äänikentässä riippuen kuulijan sen hetkisestä sijainnista kyseisessä tilassa. Tämä tila voi olla joko jonkin olemassaolevan paikan virtuaalinen vastine tai täysin kuviteltu tila. Äänimateriaali suodatetaan ja prosessoidaan digitaalisesti, jolloin tuloksena on edellämainittu illuusio, joka on luotu tietyn paikan akustisten tunnuspiirteiden avulla.<sup id="ref-58_2" class="ref"><a href="#note-58" title="(Kleiner ym. 1993, 861)">[58]</a></sup>. Auralisaatiojärjestelmä koostuu yksinkertaisimmillaan äänilähteestä, tilasta ja kuulijasta, jotka on mallinnettava erikseen<sup id="ref-58_3" class="ref"><a href="#note-58" title="(Kleiner ym. 1993, 862)">[58]</a></sup><sup id="ref-13_3" class="ref"><a href="#note-13" title="(Begault 1994, 4)">[13]</a></sup>. Siinä missä spatialisoinnilla tarkoitetaan äänen teknistä prosessointimenetelmää, auralisaatiolla viitataan tässä tutkimuksessa kattavampaan prosessiin, joka pitää sisällään koko äänimaiseman mallintamisen. Käyttöliittymässä oleellista on, että mallinnus tähtää tehokkaaseen vuorovaikutukseen ja tavoitteelliseen toimintaan.</p>
</div>
<div id="ch-3_5">
<h4>3.5 Kaiutin- ja kuulokeäänentoiston vastakkainasettelu <a title="takaisin sisällysluetteloon" href="#toc-3_5">^</a></h4>
<p>Ongelmana kaiutinäänentoistossa on, että vasemmasta kaiuttimesta kuuluva ääni havaitaan myös oikeassa korvassa ja toisinpäin (crosstalk)<sup id="ref-53_2" class="ref"><a href="#note-53" title="(Huopaniemi 1999, 30)">[53]</a></sup>. Ongelmaa on pyritty minimoimaan kehittämällä tekniikoita ristikkäisten signaalien eliminoimiseksi (crosstalk cancelled binaural processing). Huopaniemi<sup id="ref-53_3" class="ref"><a href="#note-53" title="(Huopaniemi 1999, 30)">[53]</a></sup> mainitsee kaksi rajoitusta binauraalisessa kaiutinkuuntelussa: ensinnäkin kuulijan on oltava paikallaan ja toiseksi kuunteluhuoneen on oltava mahdollisimman kaiuton. Kendallin<sup id="ref-57_9" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup> mukaan 1 millisekunnin aikana tulevat heijastukset tuhoavat siirtofunktion vaikutuksen, joten heijastukset kaiuttimien ja kuulijan lähellä on eliminoitava.</p>
<p>Kolmiulotteinen spatialisointi kaiuttimilla toistettaessa onnistuu siis parhaiten silloin, kun kuulijan sijainti kaiuttimiin nähden on etukäteen tiedossa ja pysyy samana koko ajan. Tämä viittaisi siihen, että kolmiulotteista ääntä voitaisiin käyttää kotitietokoneeseen liitettyjen kahden kaiuttimen avulla, koska tietokoneen käyttäjä istuu koko ajan paikallaan. Ongelmana ovat kuitenkin suuret tehovaatimukset ja kaiun eliminointi kotioloissa. &#8220;Crosstalkin&#8221; luotettava eliminointi voisi lisätä kaksikanavaisen, kolmiuloitteisen äänentoiston mahdollisuuksia multimediakäyttöliittymissä ja kotikoneissa<sup id="ref-56_2" class="ref"><a href="#note-56" title="(Jot 1997, 62)">[56]</a></sup>. Kaiutinkuuntelu on helpompi toteuttaa kuin kuulokekuuntelu, mutta se ei tuota yhtä luotettavaa tulosta. Kaiutinkuuntelun onnistuminen riippuu Jot&#8217;n<sup id="ref-56_3" class="ref"><a href="#note-56" title="(Jot 1997, 60)">[56]</a></sup> mukaan ainakin käytetystä tekniikasta, simuloitavien äänten suunnista, kaiuttimien suuntaavuudesta sekä kuunteluhuoneen koosta ja akustisista ominaisuuksista. Kaiutinkuuntelussa paikantaminen etualalla on huomattavasti helpompaa kuin paikantaminen takana tai yläpuolella<sup id="ref-56_4" class="ref"><a href="#note-56" title="(Jot 1997, 62)">[56]</a></sup>.</p>
<p>Etuna kuulokeäänentoistossa taas on, että kuunteluhuoneen akustiikka tai kuulijan sijainti huoneessa eivät vaikuta kuulokokemukseen<sup id="ref-53_4" class="ref"><a href="#note-53" title="(Huopaniemi 1999, 30)">[53]</a></sup>. Kuulokkeet myös mahdollistavat spatiaalisen äänilähteen sijainnin tarkemman kontrollin<sup id="ref-81_1" class="ref"><a href="#note-81" title="(Wenzel ym. 1991, 351)">[81]</a></sup><sup id="ref-63_5" class="ref"><a href="#note-63" title="(McGrath 1995, 4)">[63]</a></sup><sup id="ref-14" class="ref"><a href="#note-14" title="(Begault 1999, 14)">[14]</a></sup>. Kendallin<sup id="ref-57_10" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup> mielestä haittana voi kuitenkin olla se, että huolimatta vaihe- ja voimakkuuseroista ääntä ei koeta tulevan riittävästi pään ulkopuolelta, vaan ääni vain lateralisoituu joko vasempaan tai oikeaan kuulokkeeseen. Toinen ongelma on etu- ja taka-alan sekoittaminen, jota kuitenkin voidaan vähentää liioittelemalla huomattavasti niitä äänen spektraalisia muunnoksia, joita edessä ja takana olevat äänilähteet aiheuttavat<sup id="ref-57_11" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Kuulokekuuntelun avulla voidaan luoda luonnollisen tuntuinen kolmiulotteinen äänikenttä, mutta haittana on kallis ja monimutkainen toteutus. Tekniikan kehittyessä tämä ongelma poistunee, jolloin myös kaupallisissa sovelluksissa voidaan kuulla hyvätasoista spatiaalista ääntä.</p>
</div>
<div id="ch-3_6">
<h4>3.6 Äänen spatialisoinnin ongelmat <a title="takaisin sisällysluetteloon" href="#toc-3_6">^</a></h4>
<p>Suurimmat haasteet kolmiulotteisen äänikentän toteuttamisessa ovat Begaultin<sup id="ref-12_5" class="ref"><a href="#note-12" title="(Begault 1991, 865">[12]</a></sup> ja Kleinerin ym.<sup id="ref-58_4" class="ref"><a href="#note-58" title="(Kleiner ym. 1993, 865">[58]</a></sup> mukaan seuraavat: edessä ja takana olevien peilikuvaäänten poistaminen, paikantamisvirheiden minimointi, ihmisen havaintokyvylle riittävän siirtofunktiomittaustason saavuttaminen mahdollisimman pienellä datamäärällä sekä ratkaisun löytäminen mitattujen siirtofunktioiden ja havaitun kuulokuvan välillä vallitseviin ristiriitoihin.</p>
<p>Kuulijan voi olla vaikea paikantaa ääni edestä tai takaa tulevaksi<sup id="ref-29_12" class="ref"><a href="#note-29" title="(Burgess 1992b, 56)">[29]</a></sup>. Kendallin<sup id="ref-57_12" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup> mukaan nämä paikantamisvaikeudet pystyakselilla johtuvat korvien saamasta yhtäsuuresta vaihe- ja voimakkuusinformaatiosta, eli peilikuvaäänestä. Tällöin paikantaminen perustuu vähäisiin spektraalisiin eroihin siirtofunktion perusteella<sup id="ref-12_6" class="ref"><a href="#note-6" title="(Begault 1991, 866)">[12]</a></sup><sup id="ref-54_18" class="ref"><a href="#note-54" title="(Jauhiainen 1995, 152)">[54]</a></sup><sup id="ref-57_13" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Burgessin<sup id="ref-29_13" class="ref"><a href="#note-29" title="(Burgess 1992b, 57)">[29]</a></sup> mukaan pääasialliset vihjeet äänen sijainnista kuulijan edessä tai takana saadaan pään kääntämisen ja korvalehtien vaikutuksen perusteella. Myös simuloidun huoneen ensiheijastumien lisääminen spatialisoituun ääneen helpottaa Burgessin<sup id="ref-29_14" class="ref"><a href="#note-29" title="(Burgess 1992b, 57)">[29]</a></sup> mukaan äänen paikantumista eteen tai taakse.</p>
<p>Näitä paikantamiseen liittyviä ongelmia voidaan huomattavasti vähentää, jos spatialisaatiojärjestelmään liitetään erityinen laite, joka tarkkailee pään asentoa<sup id="ref-63_6" class="ref"><a href="#note-63" title="(McGrath 1995, 5)">[63]</a></sup>. Tällainen &#8220;head tracker&#8221; välittää tiedot pään asennosta tietokoneelle, joka päivittää samanaikaisesti suodatinparien suuntatiedot. Näin kuulija kokee päätä kääntäessään äänilähteen pysyvän koko ajan samassa paikassa<sup id="ref-57_14" class="ref"><a href="#note-57" title="(Kendall 1995)">[57]</a></sup>. Tällä tavalla voidaan todellisuutta jäljentämällä lisätä kokemusta, että ääni tulee pään ulkopuolelta. Jos ääntä ei koeta tulevan riittävän vahvasti pään ulkopuolelta, se saattaa johtua epätarkasti mitatusta siirtofunktiosta<sup id="ref-29_15" class="ref"><a href="#note-29" title="(Burgess 1992b, 56)">[29]</a></sup>.</p>
<p>Synteettisesti spatialisoitu äänikenttä &#8212; virtuaalinen kuulokokemus &#8212; voi poiketa suurestikin jäljiteltävästä akustisesta kuulokokemuksesta. Virheitä voi esiintyä joko äänilähteen, tilan tai kuuntelijan mallinnuksessa. Kolme keskeisintä paikantamisvirheiden aiheuttajaa ovat epätarkat siirtofunktiot, käytettävien äänten erilaiset ominaispiirteet (esim. taajuus ja voimakkuus) sekä järjestelmän spatiaalinen erotuskyky<sup id="ref-12_7" class="ref"><a href="#note-12" title="(Begault 1991, 865)">[12]</a></sup>. Begault<sup id="ref-12_8" class="ref"><a href="#note-12" title="(Begault 1991, 865)">[12]</a></sup>toteaa myös, että vaikka nämä kaikki kolme tekijää olisivatkin kunnossa, ongelmia voi silti aiheuttaa kuulijoiden vaihteleva paikantamiskyky. Useimmiten on tyydyttävä kompromissiin ja käytettävä keskimääräisiä siirtofunktioita. Lukemattomien yksittäisten äänten spatialisaatio eri puolille kolmiuloitteista äänikenttää vaatii tietokoneelta suurta suorituskykyä. Päämääränä spatialisoinnissa on pidettävä riittävän tarkkaa akustisen ympäristön virtuaalitoistoa mahdollisimman pienellä datamäärällä. Akustista tilaa ei tietenkään aina tarvitse edes täyttää. Kuten Chion<sup id="ref-33_19" class="ref"><a href="#note-33" title="(Chion 1990, 154)">[33]</a></sup> sanoo: spatiaalisuus suurentaa sitä tilaa, joka mahdollisesti voidaan täyttää äänillä. Tällöin päästään Blyn<sup id="ref-18_1" class="ref"><a href="#note-18" title="(Bly 1982, 375)">[18]</a></sup> mainitsemaan uuteen ulottuvuuteen. Seuraavassa kohdassa käsitellään tätä uutta ulottuvuutta muutaman sovelluksen kautta.</p>
</div>
<div id="ch-3_7">
<h4>3.7 Spatiaalista ääntä hyödyntäviä sovelluksia <a title="takaisin sisällysluetteloon" href="#toc-3_7">^</a></h4>
<p>Akustinen ekologia sopii hyvin lähtökohdaksi käyttöliittymäsuunnittelulle, koska spatiaalinen ääni kuuluu luonnolliseen ääniympäristöömme. Käyttöliittymäsuunnittelija ei kuitenkaan ole sidottu fyysiseen ääniympäristöön<sup id="ref-60_8" class="ref"><a href="#note-60" title="(Kramer 1994, 56)">[60]</a></sup>. Tietokonepeleissä on käytetty jonkin verran kolmiulotteista ääntä, joskin Goosen ja Möllerin<sup id="ref-50_4" class="ref"><a href="#note-50" title="(Goose ja Möller 1999, 366)">[50]</a></sup> mukaan näitä ääniefektejä on käytetty lähes yksinomaan tunnelman luomiseen, eikä peleissä ole juurikaan hyödynnetty äänten spatialisointia. Spatialisoinnin avulla voidaan kuitenkin tarjota lisäinformaatiota ja lisätä pelin todentuntuisuutta. Wenzelin ym.<sup id="ref-81_2" class="ref"><a href="#note-81" title="(Wenzel ym. 1991, 351)">[81]</a></sup> ja Wenzelin<sup id="ref-80_0" class="ref"><a href="#note-80" title="(Wenzel 1994, 38)">[80]</a></sup> mukaan spatiaalisen äänen käytöllä on ainakin kaksi etua: (a) objektien ja niiden välisten suhteiden havaitseminen kolmiulotteisessa tehtäväavaruudessa ja (b) useiden äänivirtojen havaitseminen samanaikaisesti, jolloin kuulija voi vaihdella huomiotaan eri äänivirtojen kesken. Tällöin siis yhdistetään objektien merkityksiä ja suuntatietoa. Tätä seikkaa on käytetty hyväksi jo useissa sovelluksissa ja prototyypeissä, joista seuraavassa esitellään tärkeimmät.</p>
<p>&#8220;AudioStreamer&#8221;-sovellus perustuu äänen spatiaaliselle erottelulle ja samanaikaiselle kuuntelulle; käyttäjä voi päätään kääntämällä valita mieleisensä kanavan kolmesta vaihtoehdosta, jolloin kyseisen kanavan äänenvoimakkuus kasvaa<sup id="ref-72" class="ref"><a href="#note-72" title="(Schmandt &amp; Mullins 1995, 218)">[72]</a></sup>. Sovelluksessa käyttäjä siis kommunikoi käyttöliittymän kanssa pään liikkeiden avulla (manuaalisen käyttöliittymän sijaan), ja peräkkäinen äänentoisto on korvattu monikanavaisella äänentoistolla. Sovellus perustuu paikallaan pysyville äänilähteille. Sawhney ja Schmandt<sup id="ref-68_0" class="ref"><a href="#note-68" title="(Sawhney ja Schmandt 1997, 110)">[68]</a></sup> ovat käyttäneet radiota metaforana äänitiedostojen selaamisessa ja kokeilleet ajatuksiaan &#8220;Nomadic Radio&#8221;&#8211;prototyypissä. He esittelevät <em>kolme spatiaalisen kuuntelun toimintatilaa</em><sup id="ref-68_1" class="ref"><a href="#note-68" title="(Sawhney ja Schmandt 1997, 111)">[68]</a></sup>:</p>
<dl>
<dt><em>Lähetys:</em></dt>
<dd>viesti lähetetään tietystä sijainnista tilassa. Viesti on kuultavissa taka-alalla hetken ennen häipymistään kuulumattomiin, ellei käyttäjä reagoi siihen ennen sitä. Vertaus perustuu radion kuunteluun, jossa kuulija aktivoituu vasta sitten, kun kuulee mielenkiintoisen kohdan.</dd>
<dt><em>Selaus:</em></dt>
<dd>käyttäjä voi selata viestejä ja tuoda jonkun niistä etualalle. Tämä vertaus perustuu radiokanavien aktiiviseen kuunteluun ja selailuun, kunnes mieluisa kanava löytyy.</dd>
<dt><em>Vilkaiseminen:</em></dt>
<dd>Nopea katsaus kaikkiin viesteihin siirtämällä ne kuuntelualueen keskelle.</dd>
</dl>
<p>Radio-metafora vaikuttaa olevan käyttökelpoinen (vaikka siinä onkin lisäominaisuutena spatiaalisuus). Koska ääni on väliaikaista, sen avulla ei voi selata useita tiedostoja samalla tavalla kuin tekstiä ja kuvia näköaistin avulla <sup id="ref-59_0" class="ref"><a href="#note-59" title="(Kobayashi &amp; Schmandt 1997, 194)">[59]</a></sup><sup id="ref-68_2" class="ref"><a href="#note-68" title="(Sawhney &amp; Schmandt 1997, 109--110)">[68]</a></sup>. Äänen sijainnin avulla voidaan antaa tietoa viestin kategoriasta tai kiireellisyydestä<sup id="ref-68_3" class="ref"><a href="#note-68" title="(Sawhney &amp; Schmandt 1997, 109--110)">[68]</a></sup>. &#8220;Multimedia Browser&#8221;&#8211;prototyypissä Fernström ja Bannon<sup id="ref-39" class="ref"><a href="#note-39" title="(Fernström ja Bannon 1997)">[39]</a></sup> kokeilivat sijoittaa useita äänitiedostoja stereoäänikenttään niiden visuaalisen sijainnin mukaan näytöllä. Osoittamalla nuolella tiettyä visuaalista objektia, vastaava äänitiedosto soi samassa sijainnissa.</p>
<p>Kobayashi ja Schmandt<sup id="ref-59_1" class="ref"><a href="#note-59" title="(Kobayashi ja Schmandt 1997)">[59]</a></sup> kehittivät spatiaalisen käyttöliittymän (&#8221;Dynamic Soundscape&#8221;), joka perustuu äänen sijainnin muistamiselle ajassa. Eteen- ja takaisinkelauksen sijaan kuuntelija vaihtaa huomiotaan liikkuvien äänilähteiden kesken (jotka toistavat saman äänityksen eri kohtia samanaikaisesti), jolloin kuuntelija voi kytkeä tietyn ajankohdan äänitiedostosta tiettyyn sijaintiin<sup id="ref-59_2" class="ref"><a href="#note-59" title="(Kobayashi ja Schmandt 1997, 194)">[59]</a></sup>. Käyttäjä voi siten selata äänitapahtumia samoin kuin selaisi visuaalisia objekteja. Vaikka käyttäjä keskittyy yhteen äänitapahtumaan kerrallaan, hän kuulee muutkin äänitapahtumat taustalla. Sen sijaan, että käyttäjät ajattelisivat &#8220;aihe jonka kuulin 20 sekuntia sitten&#8221;, he voivat ajatella &#8220;aihe jonka kuulin takavasemmalta&#8221;. Tällä tavalla spatiaalisen muistin avulla korvataan ajallisen muistin heikkouksia.<sup id="ref-59_3" class="ref"><a href="#note-59" title="(Kobayashi ja Schmandt 1997, 196)">[59]</a></sup>.</p>
<p>Toteutuksessa oli kuitenkin muutamia ongelmia: kuuntelijoilla oli vaikeuksia muistaa äänityksen tietyn kohdan sijainti<sup id="ref-59_4" class="ref"><a href="#note-59" title="(Kobayashi &amp; Schmandt 1997, 196--198)">[59]</a></sup>. Muistamista vaikeutti ainakin se, että äänitapahtumat olivat liikkuvia. Mitä hitaammin äänitapahtumat liikkuivat, sitä paremmin kuuntelijat kytkivät kohdan sijaintiin. Toinen ongelma oli, että spatiaalisen muistin resoluutio on huono: voimme sanoa, että &#8220;kohde vasemmalla ylhäällä&#8221;, mutta emme että &#8220;kohde 38 astetta keskikohdasta vasemmalle&#8221;. Spatiaalinen sijainti voidaan muistaa vain ympyrän kahdestoistaosan tarkkuudella.<sup id="ref-59_5" class="ref"><a href="#note-59" title="(Kobayashi &amp; Schmandt 1997, 196--198)">[59]</a></sup>.</p>
<p>Tekijöiden idea on kuitenkin kehityskelpoinen: vastakkainasettelu (peräkkäisen) eteen- ja takaisinkelauksen ja selektiivisen (samanaikaisen) kuuntelun välillä tuntuu toimivan. Spatiaalinen esitys tarjoaa mahdollisuuden järjestellä informaatiota ja hyödyntää käyttäjän muistia paremmin. Goose ja Möller<sup id="ref-50_5" class="ref"><a href="#note-50" title="(Goose ja Möller 1999, 363)">[50]</a></sup> taas ovat esittäneet käsitteellisen mallin <abbr title="HyperText Markup Language">html</abbr>-dokumentin rakenteen kytkemiselle spatiaaliseen ääniavaruuteen. Mallissa on uutta se, että siinä pyritään ensi kertaa kytkemään dokumentin rakenne spatiaaliseen ääneen, tavanomaisen dokumentin sisällön sijaan. Walker ja Brewster<sup id="ref-76_1" class="ref"><a href="#note-76" title="(Walker ja Brewster 2000)">[76]</a></sup> ovat tutkineet spatiaalisen äänen käyttöä mobiileissa laitteissa ja kokeilleet spatialisoitua ääntä ja sijainnin muuttumista kuvaamaan tiedoston latautumista. He päättelivät, että spatiaalinen ääni lisäsi tarkkuutta taustaprosessin monitoroinnissa ja tehosti keskittymistä samanaikaisesti suoritettuun päätehtävään<sup id="ref-76_2" class="ref"><a href="#note-76" title="(Walker ja Brewster 2000, 12)">[76]</a></sup>.</p>
<p>Edellä esitetyn perusteella voidaan päätellä, että spatiaalinen ääni muodostaa mielenkiintoisen uuden ulottuvuuden käyttöliittymään, varsinkin yhdistettäessä visuaaliseen informaatioon. Luvussa on esitetty paikantamiseen vaikuttavat tekijät, korvan &#8220;hämäämiseen&#8221; perustuva synteettisen spatialisoinnin periaate sekä keskeisimmät ongelmat sen toteutuksessa. Sovelluksista voidaan kuitenkin päätellä, että vaikeudet ovat voitettavissa: 1990-luvun loppuun mennessä jo useat sovellukset ovat menestyksellisesti hyödyntäneet spatiaalista ääntä. Mikä parasta, nämä sovellukset ovat osoittaneet käytännön toteutuksen ja koehenkilöiden kokemuksien kautta ne kohdat, joissa on parantamisen varaa. Kehitettävää todellakin on, mutta tekniikan edistyessä ongelmaksi jää edelleen se, miten spatiaalista ääntä tulisi käyttää.</p>
<p>Spatiaalinen ääni muodostaa tavallaan kannettavan &#8220;kuplan&#8221; käyttäjän pään ympärille, jolloin informaatiota voidaan järjestellä laajemmalle alueelle kuin visuaalista informaatiota. Tämä spatiaalinen kupla voidaan jakaa pienemmiksi tiloiksi, jotka sisältävät paikallisia ja globaaleja merkityksellisiä ääniä.  Enkoodaamalla äänen parametri (tässä tapauksessa spatiaalinen ääni) kuhunkin ajassa olevaan pisteeseen, saadaan aikaan &#8220;laulu&#8221;, jota kuuntelemalla voidaan määritellä merkityksellisiä kohtia ja muutoksia<sup id="ref-18_2" class="ref"><a href="#note-18" title="(Bly 1982, 374)">[18]</a></sup>. Tämä on seuraavan luvun aihe.</p>
</div>
<div id="ch-4">
<h3>4. Äänimaisema-analyysi käyttöliittymässä <a title="takaisin sisällysluetteloon" href="#toc-4">^</a></h3>
<p>Tässä luvussa pyritään yhdistämään äänen suunnan tuottama merkityssisältö käyttöliittymän toimintoihin. Luvussa tarkastellaan äänen mahdollisia funktioita käyttöliittymässä, jonka jälkeen analysoidaan ääniä semioottisessa viitekehyksessä. Lopuksi tarkastellaan erilaisia äänten luokittelujärjestelmiä. Ensin on kuitenkin pohdittava hiljaisuuden merkitystä.</p>
</div>
<div id="ch-4_1">
<h4>4.1 Hiljaisuus <a title="takaisin sisällysluetteloon" href="#toc-4_1">^</a></h4>
<p>Kun näin kauan olemme puhuneet äänestä, on tarpeen käsitellä ei-ääntä: hiljaisuutta. Chion<sup id="ref-33_20" class="ref"><a href="#note-33" title="(Chion 1990, 57)">[33]</a></sup> korostaa, että hiljaisuus ei ole koskaan neutraalia tyhjyyttä; se on aiemmin kuullun tai odotetun, kuvitellun äänen negatiivi. Kun hiljaisuus ennakoi ääntä, hermostunut odotus tekee sen eläväksi; kun taas hiljaisuus keskeyttää äänen tai seuraa sitä, hiljaisuus on täynnä sitä edeltäneen äänen jälkivaikutusta niin kauan, kuin muisti jaksaa sitä sellaisena pitää<sup id="ref-71_8" class="ref"><a href="#note-71" title="(Schafer 1977, 257)">[71]</a></sup>. Näin ääni siis luo kontrasteja. Länsimaisessa kirjallisuudessa hiljaisuus on kuitenkin usein kuvattu ahdistavaksi, yksinäiseksi tai raskaaksi, vain harvoin täyttymyksen tai tyytyväisyyden tilaksi tai muuten positiiviseksi ilmiöksi<sup id="ref-71_9" class="ref"><a href="#note-71" title="(Schafer 1977, 146)">[71]</a></sup>. Schaferin<sup id="ref-71_10" class="ref"><a href="#note-71" title="(Schafer 1977, 256)">[71]</a></sup> mielestä länsimaiselle ihmiselle hiljaisuus on negatiivista; se pitää rikkoa vaikka väkisin. Toisaalta absoluuttista hiljaisuutta ei ole olemassakaan, koska aina on jotain, joka aiheuttaa ääntä.</p>
<p>Gaverin &#8220;SonicFinder&#8221; oli menestys: totuttuaan siihen käyttäjät valittivat äänten puuttumista käyttäessään äänetöntä versiota<sup id="ref-43_5" class="ref"><a href="#note-43" title="(Gaver 1989, 82)">[43]</a></sup>. Äänikäyttöliittymään voi siis tottua. Onko meidät kuitenkin pakotettu tottumaan äänettömään käyttöliittymään ja sen piinaavaan, yksinäiseen hiljaisuuteen; hiljaisuuteen joka on vain tyhjä negatiivi ilman informaatioarvoa? Kun käyttöliittymä jaetaan äänettömyyteen ja kuuluvuuteen, myös hiljaisuus saa uuden merkityksen. Jälleen päästään kontekstiin: hiljaisuus merkitsee eri asioita eri konteksteissa. Oleellista on se, että tehdään selvä ero hiljaisuuden ja äänen välillä. On aika olla hiljaa ja aika olla äänekäs.</p>
<p>Buxtonin<sup id="ref-30" class="ref"><a href="#note-30" title="(Buxton 1989)">[30]</a></sup> mukaan ihmiset saattavat vastustaa äänen käyttöä käyttöliittymässä perustellen sitä seuraavasti: &#8220;Työskentelen hälyisässä toimistossa, enkä halua enää enempää melua häiritsemään työtäni&#8221;<sup id="ref-35_2" class="ref"><a href="#note-35" title="(Cohen 1994, 513)">[35]</a></sup>. Buxton vastaa sanomalla, että ääni on jo muutenkin läsnä kaikkialla ja että jos kontrolloisimme paremmin ääniympäristöämme, saisimme kokonaisäänimaiseman vähemmän vastenmieliseksi. Ihmiset suhtautuvat siis ääneen kaksijakoisesti: joko vastustavat sitä voimakkaasti tai suhtautuvat todella innokkaasti. Sitä paitsi meluisassa toimistossakin voi käyttää kuulokkeita, jotka eivät sulje pois toimiston muita tärkeitä ääniä. Brewster<sup id="ref-21_1" class="ref"><a href="#note-21" title="(Brewster 1994, 6)">[21]</a></sup> korostaa, että jos äänet ovat informatiivisia, käyttäjät eivät halua laittaa niitä pois päältä. Onkin mielenkiintoista, että äänen osuutta käyttöliittymässä kuvataan usein adjektiivilla &#8220;häiritsevä&#8221;. Jos käyttöliittymän äänet ovat huonosti suunniteltuja, niitä saatetaan pitää myös &#8220;huvittavina&#8221;. Tällaiset määritelmät osoittavat, että paljon on vielä tekemättä sekä asenteiden että tekniikan osalta. Harvemmin graafisia elementtejä pidetään häiritsevinä. Selvää kuitenkin on, että visuaalisesti liian täynnä oleva näyttö ei ole lainkaan miellyttävä käyttää. Eikö tämäkin ole häiritsevää?</p>
<p>Vaikka ääntä käyttöliittymässä saatetaan vastustaa (ja vaikka ääni on käytännössä suunniteltu käyttöliittymistä pois!), ihmiset joka tapauksessa kuuntelevat tietokonettaan saadakseen tietoa prosesseista, joita he eivät voi nähdä. Esimerkkinä tästä on levyaseman hurina tai tulostimen ääni.<sup id="ref-43_6" class="ref"><a href="#note-43" title="(Gaver 1989, 70)">[43]</a></sup><sup id="ref-76_3" class="ref"><a href="#note-76" title="(Walker &amp; Brewster 2000, 2)">[76]</a></sup>. Toisaalta suhtautuminen ääneen on ymmärrettävää: emme voi sulkea korviamme (toisin kuin silmiämme), joten kuuloaistin ainoa suojautumiskeino on epämieluisten äänten suodattaminen ja keskittyminen miellyttävimpiin ääniin<sup id="ref-71_11" class="ref"><a href="#note-71" title="(Schafer 1977, 11)">[71]</a></sup>. On kuitenkin otettava huomioon, että myös epämiellyttävät äänet ovat merkitseviä. Seuraavaksi tarkastellaan äänen funktioita käyttöliittymässä.</p>
</div>
<div id="ch-4_2">
<h4>4.2 Äänen käyttötarkoitus <a title="takaisin sisällysluetteloon" href="#toc-4_2">^</a></h4>
<p>Ääntä on yleensä käytetty elokuvassa ainakin kuvien yhdistämiseen (ylimeno) tai ilmapiirin luomiseen<sup id="ref-33_21" class="ref"><a href="#note-33" title="(Chion 1990, 47)">[33]</a></sup>. Perinteisessä elokuvatutkimuksessa elokuva ilman ääntä pysyy elokuvana, mutta elokuva ilman kuvaa ei ole enää elokuva<sup id="ref-33_22" class="ref"><a href="#note-33" title="(Chion 1990, 143)">[33]</a></sup>. Tämä ajattelumalli kuvaa hyvin visuaalisen informaation ylivaltaa, vaikka kokeellisissa elokuvissa näitä kirjoittamattomia sääntöjä onkin pyritty tietoisesti rikkomaan. Chionin<sup id="ref-33_23" class="ref"><a href="#note-33" title="(Chion 1990, 145--148)">[33]</a></sup> mukaan äänielokuvan alkuaikoina ei ollut teknisesti mahdollista käyttää monia ääniä päällekkäin, koska silloin ne eivät olisi erottuneet toisistaan. Jos käytettiin useita ääniä, yhden piti olla ylitse muiden. Tähän saattoi Chionin mielestä olla myös kulttuurisia syitä: melu ei useimpien ihmisten mielestä ole esteettisesti kiehtovaa.<sup id="ref-33_24" class="ref"><a href="#note-33" title="(Chion 1990, 145--148)">[33]</a></sup>. Melu on määritelty epämieluisaksi, epämusikaaliseksi tai kovaksi ääneksi (vaikka &#8220;epämieluisa ääni&#8221; on subjektiivinen kokemus, se nojaa myös yhteisön tuottamiin sopimuksiin)<sup id="ref-71_12" class="ref"><a href="#note-71" title="(Schafer 1977, 182--183)">[71]</a></sup>.</p>
<p>Schafer<sup id="ref-71_13" class="ref"><a href="#note-71" title="(Schafer (1977, 205)">[71]</a></sup> pitää maailman äänimaisemaa yhtenä suurena sävellyksenä, johon kaikki ihmiset osallistuvat säveltäjinä, esiintyjinä ja kuulijoina. Prosessiin kuuluu eri äänten analysointi ja päättäminen siitä, mitä ääniä haluamme säilyttää ja mitä poistaa. Tällä tavalla voidaan päästä melusta eroon. Vaikka tällainen näkemys on melko naivi, se saattaa olla mahdollista toteuttaa pienemmässä mittakaavassa: käyttöliittymässä suunnittelija voi toimia säveltäjänä, esiintyjänä ja kuuntelijana.</p>
<p>Chion<sup id="ref-33_25" class="ref"><a href="#note-33" title="(Chion 1990, 73)">[33]</a></sup> esittelee mielenkiintoisen viitekehyksen äänen kolmijakoisesta roolista elokuvassa: äänitapahtuma voi olla joko (a) näytöllä (onscreen), (b) näytön ulkopuolella näkymättömissä (offscreen) tai (c) näkymättömissä, mutta ei myöskään missään suhteessa näytöllä oleviin tapahtumiin (nondiegetic, esimerkiksi musiikki). Chion kritisoi itsekin tätä jakoa puutteelliseksi ja lisää<sup id="ref-33_26" class="ref"><a href="#note-33" title="(Chion 1990, 82--83)">[33]</a></sup>, että jos suljemme silmämme tai katsomme muualle, näytön ulkopuoliset äänet muuttuvat näytöllä oleviksi ääniksi. Äänen rooli syntyy siis visuaalisen ja äänellisen yhteistyönä. Chion<sup id="ref-33_27" class="ref"><a href="#note-33" title="(Chion 1990, 75)">[33]</a></sup> lisää tähän kolmijakoon vielä äänitapahtumat, jotka ympäröivät tilaa ilman, että kiinnitetään huomiota niiden tunnistamiseen tai tarpeeseen nähdä niiden lähde. Niiden avulla voitaisiin kuitenkin tunnistaa jokin tila. Chionin näkökulma lähenee tässä kohdin Schaferin<sup id="ref-71_14" class="ref"><a href="#note-71" title="(Schafer 1977)">[71]</a></sup> ja Sauen<sup id="ref-67_0" class="ref"><a href="#note-67" title="(Saue 2000)">[67]</a></sup> näkemyksiä äänimaisemasta. Chionin elokuvateoriat ovat erityisen hyödyllisiä myös käyttöliittymäkontekstissa, koska jako näytöllä ja sen ulkopuolella oleviin äänitapahtumiin viittaa piiloinformaation olemassaoloon.</p>
<p>Äänen funktiona ei ole (pelkästään) viihdyttäminen, vaan piiloinformaation tunnistaminen ja esittäminen käyttäjälle<sup id="ref-45_0" class="ref"><a href="#note-45" title="(Gaver 1993b, 228)">[45]</a></sup><sup id="ref-16_10" class="ref"><a href="#note-16" title="(Blattner ym. 1994, 467)">[16]</a></sup>. Tämä näkemys kiteyttää oleellisen ja pitää sisällään laajan kirjon mahdollisia käyttötarkoituksia. Herefordin ja Winnin mukaan<sup id="ref-51_4" class="ref"><a href="#note-51" title="(Hereford ja Winn 1994, 212--213)">[51]</a></sup> äänellä on käyttöliittymässä kaksi funktiota: (a) ääni kertoo käyttäjälle järjestelmän tilasta kullakin hetkellä hälytysäänillä tai &#8220;tarkkailemalla&#8221; taustalla kunnes käyttäjä vaatii tietoa järjestelmän tilasta ja (b) välittää ohjelmien tuottamaa tietoa. Buxton<sup id="ref-31_0" class="ref"><a href="#note-31" title="(Buxton 1990, 124--127)">[31]</a></sup> taas jakaa äänet käyttöliittymässä kolmeen luokkaan sen mukaan, minkälaista informaatiota ne välittävät:</p>
<ul>
<li>hälytys- ja varoitusäänet</li>
<li>järjestelmän tilasta kertovat äänet</li>
<li>koodatut viestit.</li>
</ul>
<p>Varoitusäänten (yleensä kovia ja korkeita ääniä) tarkoituksena on keskeyttää meneillään oleva tehtävä. Järjestelmän tilasta kertovien äänten tarkoituksena on välittää informaatiota meneillään olevasta tehtävästä tai prosessista. Tällaiset äänet ovat yleensä pitkiä ääniä tai toistuvia kuvioita, jotka häipyvät taka-alalle prosessin päättymisen jälkeen. Näin käyttäjä voi keskittyä päätehtävään (kunnes ääni taas ilmaantuu etualalle ilmoittaen prosessissa tapahtuvasta muutoksesta). I