Hangkártyák programozása retro 4.

2.2.9. Hangforrások és hangok csoportosítási lehetőségei

Hangforrásnak nevezzük azt a helyet, amely a hangot produkálja. Azonban gyakorlati szempontból bonyolultabb a kérdés, mivel a hangforrások általában összetettek.

Általában a következő hangforrásokat különböztetjük meg egymástól:

  • Biológiai hangforrások: emberi és állati hangok,
  • Természeti hangforrások: szélzúgás, mennydörgés,
  • Hangszerek: zenei célokat szolgáló, mechanikai rezgés-átalakítók,
  • Technikai hangforrások: gépek, munkaeszközök, közlekedési eszközök,
  • Elektroakusztikai hangforrások: átalakítók, hangszórók.

Tehát a hangforrás valamilyen hangot „ad ki”. Természetesen ezen hangok is különböző típusúak lehetnek. A hangok fizikai felosztása minőségi szempontból:

1)      Forma szerint:

  • Tiszta hang (szinuszos jellegű),
  • Zenei hang (periódusos jellegű),
  • Zörej (statisztikus jellegű, periódus nélküli),
  • Összetett hang (több azonos, vagy nem azonos formából kevert jellegű),

2)      Az időbeli forma változása szerint:

  • Állandó hang (jellegét hosszabb ideig megtartja),
  • Változó hang (átmeneti jellegű bármilyen szempont szerint),
  • Szakaszos hang (szünetek szakítják meg),
  • Egyszeri hang (hosszabb ideig nem ismétlődik),

3)      Időtartam szerint:

  • Impulzus hang (0,1 s-nál rövidebb),
  • Rövid idejű hang (0,1 és 1 s közötti),
  • Tartós hang (1 s-nál hosszabb),
  • Hosszú idejű (60 s-nál nagyobb).

Szerkezeti szempont alapján történő csoportosítás:

1)      Állandósult:

  • Előre meghatározott (determinisztikus),
  • Szinuszos (tisztahang),
  • Periódusos (zenei hang),
  • Kváziperiódusos,
  • Véletlenszerű (sztochasztikus),

2)      Átmeneti:

  • Folyamatos (kvázisztochasztikus: beszéd, zene),
  • Egyszeri esemény,
  • Berezgés,
  • Lecsengés,
  • Átkötés,

3)      Lökésjellegű

  • Egyszeri (impulzus),
  • Többszöri (impulzussorozat),
  • Periódusosan ismétlődő (kváziperiódusos),
  • Szabálytalanul ismétlődő.

2.2.10. Fourier-analízis

Bár a későbbiekben bőven lesz szó e témáról és annak matematikai alapjairól, mégis fontos, hogy legalább bevezető jelleggel ismertessünk néhány alapvető dolgot, amely szükséges a hanghullámok komolyabb megismeréséhez. Jean Baptiste Joseph de Fourier, francia matematikus 1822-ben bebizonyította, hogy bármilyen periodikus függvény felbontható különböző amplitúdójú és fázisú függvényekre. Vagyis bármilyen periodikus jelfüggvény előállítható különböző szinuszhullámok súlyozott összegeként. A Fourier-analízis segítségével meg tudjuk határozni egy összetett hullám alkotóelemeit. A spektrum egy olyan koordinátarendszer, amelynek függőleges tengelyén az amplitúdót, függőleges tengelyén pedig a frekvenciát ábrázoljuk. Az ábrázolást követően kiolvashatjuk, hogy milyen frekvenciájú és amplitúdójú jeleket kell összegeznünk ahhoz, hogy a kívánt jelhez jussunk. A mesterséges hangzás megvalósításában komoly szerepe lesz a Fourier transzformáltnak. F.2-ben néhány fontosabb függvény és Fourier transzformáltja látható. F.33. pedig egy olyan program listáját közli [4] alapján, amely a négyszögjelet állítja elő különböző szinuszhullámok súlyozott összegeként.

Amplitúdómoduláció: az a jelenség, mely során egy hang amplitúdója valamilyen periódussal kismértékben, de szabályosan változik. A F.2. második ábrája erre mutat példát.

Frekvenciamoduláció: az a jelenség, mely során egy hang frekvenciája kismértékben periodikusan változik.

F.2. Néhány jellegzetes függvény és spektruma

2.2.11. Az egyszeri hang burkológörbéje

Amikor hosszabb ideig nem ismétlődő, egyszeri hangokat vizsgálunk, észrevehetjük, hogy azok a megszólalástól az elhalásig folyamatosan változnak. Ha az amplitúdó változását az idő függvényében ábrázoljuk, megkapjuk az adott hang burkológörbéjét, amely a következő szakaszokra osztható általában:
  • felfutási (attack),
  • lecsengési (decay),
  • kitartási (sustain),
  • elhalási (release).

Tehát a hang amplitúdója felfut egy bizonyos szintre, majd lecseng, és a kitartási szinten marad, ezt követően pedig elhal. Természetesen nem csak a fenti szakaszokkal rendelkező úgynevezett ADSR burkológörbe létezik, hanem olyan burkológörbe is, amely ennél lényegesebb több szakasszal jellemezhető. Annyi biztos, hogy minimálisan egy felfutási és egy lecsengési szakasz alkotja az egyszeri hang burkológörbéjét. A burkológörbe jellegzetes szakaszait a F.3-ban tanulmányozhatjuk.

F.3. Az egyszeri hang burkológörbéjének egyes szakaszai

2.3. Bevezetés a fiziológiai hangtanba

Ebben a részben áttekintjük a hang szubjektív érzékelésével kapcsolatos alapokat.  Jellemző a hangtan eme ágára, hogy eredményeit főleg statisztikai módszerek felhasználásával produkálja, ami azt jelenti, hogy rengeteg, lehetőleg különböző, emberen kell elvégezni az adott kísérleteket, s csak azt követően lehet komolyabb következtetéseket levonni. Meg kell jegyezni, hogy a hangok szubjektív érzékelése nem követi a Fechner-Weber-féle logaritmikus törvényt, tehát a szintekkel kifejezett növekedést.

Az egyik kísérlet a hang legfontosabb érzeti jellemzői közül a hangossággal kapcsolatos. Az első mérések végzői után Fletcher-Munson görbéknek nevezték el az azonos hangossági szintek görbéit, melyeket többszőr is megmértek és szabványosítottak. Ezen karakterisztikák az alábbi feltételek teljesülése esetén érvényesek:

  • a hangforrás frontálisan helyezkedik el a hallgatóhoz képest,
  • a hallgató akusztikai szabadtérben van és a hanghullámok síkhullámként érkeznek hozzá,
  • a hangnyomást a megfigyelés helyén, a hallgató távollétében mérik,
  • a hallgatás mindkét füllel egyszerre történik,
  • a hallgató kora 18 és 25 év közötti, és normális hallású.

Az azonos hangossági szintek görbéinél 100 Hz-es frekvenciát választottak. Az egyéb frekvenciákon ugyanakkora hangossághoz szükséges hangnyomásszinteket meghatározták és az így kapott pontokat összekötötték. Az 1000 Hz-en megállapított szintet rendelték ehhez a görbéhez, de ez már a szubjektív érzetet tükröző hangosságszint, ezért megkülönböztetésül 1 phon a mértékegysége. Az 1000 Hz-en érvényes p=p0 –nak megfelelő 0 dB-es vonatkoztatási szinthez tartozó hangosságszint 0 phon. Az új mérések szerint a hallásküszöb 1000 Hz esetén 4,2 dB-el egyenlő, szemben a vonatkoztatási értékhez tartozó 0 dB-el, azaz a korábban meghatározott küszöbértékkel. Ezért ajánlatos különbséget tenni a küszöbérték és a vonatkoztatási érték között.

2.3.1. A hang szubjektív magassága

A hang szubjektív magasságának egysége: 1 mel. 1000 mel: 1000 Hz frekvencián, 40 phon hangosságszintnél. 500 mel szubjektív magasságúnak tekintjük azt a frekvenciát, amelynél az átlagos normális hallású ember fele akkora zenei magasságúnak érzékeli a hangot az eredeti 1000 Hz-es hanghoz képest. Hasonlóképpen 2000 mel szubjektív magasság azt a frekvenciát jelenti, amelynél a szubjektív megítélés kétszeres hangmagasságot állapít meg. A hang szubjektív magassága némileg függ az adott hang hangosságától is. Például 100 Hz-en 40 phon-ról 100 phon-ra növelve a hangosságot, a szubjektív hangmagasság körülbelül 10%-kal csökken, vagyis egy teljes zenei hanggal. Ezzel szemben körülbelül 4 kHz fölötti magas hangoknál a hangosság növekedésekor a hang szubjektív magassága is növekszik.

2.3.2. A fül iránykarakterisztikája

A hangforrás irányának megállapításakor az irányhatás és a két fülre érkező hang időkülönbsége, illetve fáziskülönbsége is érvényesül. Az irány-lokalizálásban jelentős szerepe van a Haas-féle jelenségnek, amely abban nyilvánul meg, hogy a hangforrás helyét aszerint állapítjuk meg, hogy honnét érte fülünket az első hullámfelület. A következő hullámokat már 10dB-lel nagyobb intenzitással és 50 ms-nyi késéssel is érkezhetnek anélkül, hogy az eredeti irányérzékelést helyesbítenénk.

Több hang egyidejű hangzásakor a fülben további, úgynevezett aurális hangok is jelentkeznek, amelyek az eredeti hangok összegéből, illetve különbségéből, egyéb kombinációiból jönnek létre, és a fül nem lineáris átviteli karakterisztikái okozzák. Ezek annál inkább érvényesülnek, minél nagyobb az eredeti hangok hangossága és minél mélyebbek az eredeti hangok. Ha egyszerre több harmonikus hangjel éri el a fülünket, akkor az erősseb jel elfedi a gyengébbet, mert a fül érzékenysége csökken a gyengébb hangra vonatkozóan.

Ha például 1200 Hz közepes frekvenciájú keskenysávú zörejt hozunk létre, és ennek különböző intenzitásaihoz mérjük a többi frekvenciájú harmonikus (szinuszos) jel hallhatósági küszöbét, azt tapasztaljuk, hogy az 1200 Hz körüli tartományban csökken a hallószerv érzékenysége. Az így megállapított küszöbkarakterisztikát elfedési küszöbnek nevezzük. Ez a hatás az elfedő hang intenzitásától is függ.

Sok egyidejű hang eredő hatása bonyolult módon összesíthető. Közelítőleg azt mondjuk, hogy az erősebb hang elfedi a gyengébbet, ha a szintje 10 dB-lel nagyobb és frekvenciájuk 1 oktávon belül van. A mélyebb hangoknál az elfedés nem lépi túl az oktávnyi szélességet, de a magasabb hangoknál az elfedő hang nagyobb intenzitása esetén az elfedési jelenség a legmagasabb hallható frekvenciáig terjed.

Időtartományban is jelentkezik elfedési jelenség. Azt könnyű belátni, hogy nagy intenzitású hangot közvetlenül követő kis intenzitású hang nem hallatszik, mert az erős hang süketít. Azt azonban nehéz felfogni, hogy egy halk hangot elfedhet egy később megszólaló erős hang, mert ez látszólag ellentétes a kauzális rendszerek viselkedésével. De természetesen ennek is megvan a maga ésszerű magyarázata: az erősebb hang ingerülete gyorsabban terjed a hallószervben és az idegekben. Még lineáris rendszer esetén is belátható, hogy ez így történik.

2.3.3. Hangosság

Sem a hangnyomás, sem annak szintje, de még a hangosság szintje sincs összhangban a hangosság szubjektív érzékelésével. Ezek a jellemzők fizikai szempontból jól definiálhatók, de a szubjektív módon érzékelt hangosság ezekkel nem egyezik meg. Tekintettel az elfedési jelenségekre, a hangosság egy egyszerűen nem mérhető, és a phonokban mért azonos hangosságszintekkel csak akkor mutatható ki az egyezés, ha harmonikus hangok esetén mérjük a hangosságot. Például a zajok csaknem mindig összetettek, mivel több, különböző frekvenciájú komponens eredőjeként jönnek létre. Ezért a hangosság számszerű kifejezéséhez a zajspektrumot fel kell bontani adott frekvenciákra, külön kell mérni minden frekvenciát, vagy frekvenciasávot, és csak ezt követően kaphatjuk meg a végeredményt.

Ha szubjektív kísérleteknél azt a kérdést tesszük fel, hogy milyen hangmagasságon érzékel az átlagos megfigyelő az 1000 Hz frekvenciájú hangnál kétszer hangosabbat, akkor eljutunk a phonokban kifejezett hangosságszint és a sonokban megadható hangosság közötti összefüggéshez:

(2.14)
ahol N a hangosság és LN a hangosságszint.

2.3.4. Hangszín

A természetben leginkább összetett hullámokkal találkozhatunk. A hangokat a hangszín szerint lehet megkülönböztetni. A hangszín nem pontosan definiált fizikai fogalom, kimondottan szubjektív érzékelésen alapszik. Gyakorlatilag a hang összetevőinek és átmeneti jelenségeinek, különböző modulációinak összességét nevezhetjük hangszínnek. Látható tehát, hogy rengeteg dologtól függ: mechanikai kialakítástól, a hangkeltő eszköztől, az anyag tulajdonságaitól.

[4]   László József: Hangkártya programozása Pascal és Assembly nyelven, Computer Books, Budapest, 1999

Hírdetés

Hangkártyák programozása retro 2.

2. Hangtani alapfogalmak

2.1. A hang, mint jelentéshordozó médium

Fontos, hogy elsőként tisztázzuk, mit is értünk „hang” alatt, hiszen ez a fogalom is olyan hétköznapinak és egyszerűnek tűnő, hogy amikor meg kell fogalmaznunk miről van szó, szinte  zavarba jövünk  és elgondolkodunk a pontos definíción. Amire biztos, hogy utoljára gondol a hétköznapi ember az a hangnak, mint fizikai jelenségnek  a magyarázata. Pedig az elsősorban nem más, mint valamilyen rugalmas közeg mechanikai zavarási állapota, amely a közeg rugalmassága miatt az energia támadási helyén rezgés alakjában jelentkezik és a hatás a rendelkezésre álló térben továbbterjed. A zavarási állapot gáznemű és folyékony közegben nyomásingadozás, míg szilárd testekben lényegesen bonyolultabb alakváltozási folyamat.

Természetesen az embernek elsőként az jut eszébe, hogy „hang az, amit hallunk”. Az ilyen, élettani szempontú megközelítés pontosabb, tudományos megfogalmazása:  „a hang füllel érzékelhető inger ”. Következésképpen a hang fizikai szempontból sokkal tágabb fogalom, hiszen vannak olyan hangok amit például semmilyen módon nem vagyunk képesek érzékelni.

Azonban a hanghoz nem egyszerűen biológiai szempontból viszonyulunk, vagyis, hogy „hallom-e a hangot, vagy sem”, hanem annak fontos szerepe van a kommunikációban, s az információszerzésben. Hangélményről beszélünk, amikor megkülönböztetjük a fizikai és az emberi fül által hallható hangokat. Látható tehát, hogy a hang számunkra fontos értelmi, érzelmi és esztétikai hatással is bír, mint jelentéshordozó médium.

Fizikai szempontból az általunk „zaj”-nak nevezett és ártalmasként, zavaróként, valamint kellemetlenként jellemzett hang sem más, mint a többi. Az informatív hanggal szemben az ember számára a zaj redundancia, mindamellett, hogy bizonyos típusai akár komoly sérüléseket is okozhatnak – gondoljunk csak a zajártalomra, s a halláskárosodásra. Ahol nincs élőlény, ott értelmetlen a hangérzet és a zaj fogalma.

Érdekes, hogy míg az egyik személy számára egy bizonyos hang információt hordoz, addig a másikat éppenséggel zavarhatja. Ilyen például a házőrző kutya vad ugatása, ami a szomszéd számára zavaró lehet, főleg éjszaka, viszont a tulajdonos számára fontos jelzés, hogy illetéktelen személy kísérel meg behatolást az adott területre. Ha esztétikai szempontból vizsgáljuk a kérdést, más és más a megítélése egy zeneműnek, s ebben szerepe van a különböző ízléseknek is. Azonban lehetséges, hogy egy dal, amit egyébként kedvelek, nem tetszik annyira, ha egy kis szobában bömböl. De akár említhetnénk egy szónoklatot is, amely egyeseket lelkesít, mások közömbösek iránta, megint másokban félelmeket kelt.

Látható tehát, hogy a hangot legalább kétféle szempontból érdemes alaposan tanulmányozni. Az egyik egy természettudományos matematikai és fizikai szempont, a másik egy inkább emberközpontú, úgynevezett fiziológiai szempont.

Folytatjuk.