hlavní-stránka/clanky/metody-zvukove-syntezy/

Metody zvukové syntézy

Jak vytvořit zvuk

text | telotone

Ve zvukové syntéze rozlišujeme dvě základní pojetí. Prvním je vytváření zvuků napodobujících co nejvěrohodněji klasické akustické nástroje modelováním reálného zdroje, tím druhým je vytváření zcela novýh zvuků, nemající v okolním světě žádnou obdobu. Obě pojetí se vzájemně prolínají a od jednoho k druhému přestoupíme třeba i změnou jediného parametru.

Napodobení již existujícího nástroje je o něco složitější disciplínou, protože můžeme neustále srovnávat se skutečným nástrojem, jehož nedostatky bývají často ctností a zvukovou kvalitou. Hudební nástroj nelze zidealizovat statickou posloupností diskrétních čar spektra, jak bychom očekávali u čistého tónu. Ve hře je mnoho faktorů, jejichž vliv se dá do modelu těžko přidávat nebo na jejichž vliv není brán vůbec zřetel. U piána je to například neperiodický zvuk kladívka nebo rezonance sousedních strun. Výsledné spektrum není potom diskrétní, ale částečné spojité, což se dá posléze obtížně generovat. V současné době je hojně používané hybridní pojetí, kdy je reálný nástroj nasamplován, ale současně si s sebou nese jednoduchý model, který umožní zvuk následně zčásti modifikovat.

K dnešní době známe hned několik metod elektronické syntézy. Jednotlivé syntézy nejsou však vzájemně zcela zastupitelné, čímž se myslí nemožnost dosažení konkrétního zvuku při použití odlišných metod. Většinou však nejde přímo o nemožnost, ale spíše o zvýšenou krkolomnost a neobratnost v dobrání se kýženému výsledku.

Literatura [1] člení zvukovou syntézu na následující metody:

Součtová syntéza

Součtová syntéza, nebo také často aditivní syntéza, patří k nejstarším způsobům generace zvukového signálu. Je založena na prostém součtu jednoduchých signálů, v nejjednodušším případě prostých sinusovek. Vše se dá vyjádřit vzorcem:

kde A_k…amplituda, ω_k…frekvence, φ_k…fáze k-té složky tónu při počtu složek N. Aby se vystihla i nestacionarita signálu bylo by nutné vyjádřit všechny proměnné k-té složky jako funkci času. Příklad zastoupení jednotlivých harmonických u reálných nástrojů je na následující tabulce.

Tab. 1 Sbírka amplitudových spekter (sloupce jsou jednotlivé harmonické)

Zkušený analytik dokáže již na základě takovéto tabulky odhadnout výsledný zvuk. Při syntéze zvuků tónového charakteru jsou poměry mezi frekvencemi jednotlivých harmonických celočíselné nebo kvazičíselné. Počet slyšitelných složek může nabývat až 250, ale k přijatelné aproximaci si obyčejně vystačíme jen s prvními deseti. Součtová syntéza je považována za nejdokonalejší a nejautonomnější metodu zvukové syntézy, u níž má hudebník neustálou kontrolu nad celým procesem. Přes tyto klady není tato metoda samostatně komerčně rozšířena. Argument konstrukční náročnosti je dnes sice smazán použitím výpočetní techniky, ale přesto tento koncept nepřináší hudební uspokojení. Velká kontrola procesu sebou přináší také velké úsilí pro dosažení konkrétního cíle, který by byl dosažen jen změnou jednoho parametru odlišnou metodou. Někdy je totiž náhoda a nepředvídatelnost méně průhledných technik tím nejkreativnějším prvkem.

Rozdílová syntéza

Rozdílová syntéza je bezesporu jedna z nejrozšířenějších a komerčně nejúspěšnějších metod. Oblibu si získala ve své realizační jednoduchosti a současně vysoké zvukové účinnosti. Hlavně v západních zdrojích je pro svůj princip nazývaná kromě subtraktivní též jako analogová. Fyzikální princip subtraktivní syntézy je ve formální shodě s přirozeným vznikem zvuků v hudebních nástrojích nebo v tvorbě lidského hlasu [1].

Tak například při modelování tvorby řeči je celý řetězec hlasového traktu zobecněn na buzení a filtr. Pulzní buzení vznikající přirozeně v hlasivkách je nahrazeno jiným frekvenčně bohatým signálem. Rezonanční dutiny (nosní, hrdelní, ústní) a překážky jako jazyk rty a zuby jsou zobecněny jediným řízeným filtrem, který slouží jako rezonanční obálka tvarující vstupní signál. Další analogií je hra na housle, kde je spektrum zdrojového zvuku (kmitající struna) tvarováno rezonátorem (korpus houslí) (obr. 1).

V procesu nevznikají žádné nové frekvenční složky signálu, ale ty stávající jsou pouze potlačeny nebo naopak zvýrazněny. Tato skutečnost nás omezuje v tvorbě úplné množiny zvuků, a tak bývá rozdílová syntéza doplňována dalšími metodami jako frekvenční nebo amplitudová modulace. Filtr bývá realizován jako dolní respektive pásmová propust s řízenou frekvencí poklesu a činitelem jakosti. Oproti řečovému signálu, který mívá několik zřetelných rezonančních frekvencí nazývaných formanty, zjednodušujeme situaci u hudebního signálu obvykle jen na jednu rezonanci uskutečněnou jednoduchým čtyř-pólovým filtrem. Neméně důležité je řízené zesílení výsledného signálu amplitudovou obálkou dodávající signálu dynamické vlastnosti reálných nástrojů.

Obr. 1 Tvorba barvy nástroje

Modulační syntéza

Modulační metody zvukové syntézy těží z nelineární povahy modulačního procesu, kdy vznikají zcela nové harmonické složky úměrné součtům a rozdílům již přítomných frekvencí. V případě komplexního nosného signálu vzniká bohatý a hutný zvuk, který může mít jak tónový, tak i šumový charakter v závislosti na racionalitě poměrů přítomných frekvencí. Všechny tři parametry, tj. nosná frekvence ω0, modulační frekvence Ω i index modulace β mohou být časově proměnné, čímž se docílí vývoje spektra, nebo přechod mezi tónovým a hlukovým charakterem zvuku. Obyčejně je možné použít několikanásobnou modulaci, nebo třeba i zpětnovazební modulaci sebou samým.

Frekvenční modulace

Na rozdíl od amplitudové, či kruhové modulace, které se používají spíše jako doplňkové efekty k jiným typům syntéz, si frekvenční syntéza získala postavení autonomní syntézy, která naplnila všechny objektivní příčiny zvuku [1]. Umožňuje plynulý přechod mezi harmonickými a neharmonickými strukturami jednoduchým rozlaďěním modulační frekvence vůči nosné v iracionálním poměru. Oproti rozdílové syntéze není limitována pevnou harmonickou strukturou.

Frekvenční modulace je velmi vhodná pro různé efekty a ruchy. Je kupříkladu velmi vhodná pro emulaci zvonů.

Tvarová syntéza

Pod pojmem tvarová syntéza se skrývá mnoho rozmanitých technik vytváření zvukového signálu, které na rozdíl od dosud zmíněných metod, používají operace přístupné v časové doméně.

Nelineární tvarování

Metoda nelineárního tvarování je založena na průchodu signálu obvodem s nelineární charakteristikou. Nelinearitou vznikají součtové a rozdílové složky vstupního signálu, tedy na rozdíl od předešlých metod zcela nové harmonické složky.

Obr. 2 Nelineární tvarování signálu

Přímé zadávání časového průběhu

Za pomocí grafického prostředí nebo proměnných parametrů je možné přímo měnit tvar signálu. Nevýhoda tohoto jednoduchého procesu vycházející z méně průkazné časové oblasti je téměř nulová kontrola výsledného vyznění.

Obr. 3 Zadávání časového průběhu

Fázové zkreslení

Fázové zkreslení přehází v diskrétní podobě jednotlivé vzorky v periodě, takže vznikne nový tvar vlny s novým spektrem.

Obr. 4 Fázové zkreslení

Segmentační syntéza

Segmentační metody skládají požadovaný průběh signálu ze segmentů přesně zadaných křivek. Tímto můžeme klasický proces vzorkování chápat jako obdélníkovou segmentaci. Lineární segmentace neboli prosté spojení definovaných bodů má časté využití při realizaci ovládacích signálů, například amplitudová obálka.

Granulační syntéza

Granulační syntéza používá pro generování zvuků krátkých úseků zvuku (okolo 50ms) tzv. granulek. Tyto úseky se přehrávají velmi rychle za sebou, takže lidský mozek je vnímá jako spojitý zvuk. Je to jistá obdoba ke konkatenační syntéze při umělé tvorbě řeči skládáním fonémů.

Samplovací metoda

Nejedná se přímo o techniku vytvářející nový signál, jak to bylo v předešlých případech, ale spíše o úplně novou filozofii nakládání se zvukem. Spíše tedy než o syntezátor se jedná o přehrávač předem uložených zvuků. Výhoda věrného přednesu nasamplovaného nástroje a v dnešní době jednoduché realizace je smutně vyvážena nízkou variabilitou výsledného zvuku a často strojově mdlým přednesem. Hráč má jen omezené možnosti tvůrčího projevu, ale může zároveň disponovat obrovským množstvím již předem připravených zvuků.

Fyzikální modelování – virtuální akustická syntéza

V roce 1993 přišla firma YAMAHA s naprosto novou koncepcí hudebních nástrojů - s virtuálně akustickými syntezátory, které nejsou jen lepší modifikací starších syntezátorů. Jde o zcela odlišné nástroje, pracující na jiném principu, než je přehrávání nasamplovaných zvuků. U všech nástrojů, zvláště dechových, se zjišťoval způsob tvorby zvuku a veškeré jevy, které se při tvorbě zvuku uplatňují. Fyzikální model každého nástroje je tedy de facto souhrn maximálního množství údajů, které nástroj popisují. U dechových nástrojů to může být například materiál, z něhož je nástroj vyroben, vlastnosti plátku, hubičky, tvar vzduchového sloupce uvnitř nástroje apod. Z těchto parametrů je virtuálně akustický nástroj schopen v reálném čase vypočítat kýžený zvuk, který je víceméně totožný se zvukem skutečného nástroje. Zatímco dosud používané technologie simulují zvuk, VAS simuluje přímo nástroj. [cit. 3]

Princip VA syntézy vychází z obecného modelu akustického nástroje a je na první pohled velmi podobný struktuře rozdílové syntézy (obr. 5). Oproti ní však klade mnohem větší důraz na způsob buzení (EXCITÁTOR). U hudebního nástroje a VA syntézy je těžiště v aktivní generaci tónu (například interakce smyčce a struny), kdežto v případě subtraktivní syntézy v aktivním zpracování signálu (řízená filtrace a zesílení) [cit. 1].

Obr. 5 Princip VA syntézy

Řada autorů vidí právě v tomto způsobu syntézy budoucnost vývoje elektronických nástrojů. Syntéza není limitována svojí technologií a její zvuk s ní není ztotožněn, jako je tomu například u subtraktivní syntézy. Výsledný zvuk je změnou svých parametrů předvídatelný a je úzce spjat s přirozeným fyzikálním chápáním okolního světa. Zvětšíme-li například rozměr rezonátoru, dá se předpokládat, že výsledný zvuk bude hlubší a mohutnější. Tato intuitivnost se dalším hraním výrazně zlepšuje a umožní lépe realizovat hudebníkův záměr. Dalším kladem VAS syntézy je zvuková podobnost či přesnost imitace. Samplovací metoda sice dokáže velmi zdatně reprodukovat zvuk napodobovaného nástroje, v kontextu větších hudebních celků však oproti VAS selhává [2]. Fyzikální modelování dokáže napodobit i takové nuance přechodových jevů jako jsou dýchání, cvakání kláves, klouzání prstů a přenos rezonance předchozích tónů. Všechny tyto zdánlivě parazitní efekty humanizují elektronické dílo a přispívají ke komplexnímu přednesu. Smysluplnost imitativní role je často zpochybňována potřebou specifického ovladače ne nepodobnému skutečnému nástroji. Nabízí se tedy otázka proč používat elektronický model ovládaný takovýmto klonem namísto skutečného nástroje. Nepostavíme-li obhajobu na obrovském potenciálu při tvorbě nových kontrolovatelných zvuků, můžeme zmínit i vznik nové kreativní roviny použitím nestandardních ovladačů jako třeba ovládat kytaru dechovým nástrojem.

26/06/2009


Vložit komentář

18.12.2010 11:38 | telotone

Mohl bys to trochu konkrettizovat?

lll

15.12.2010 09:23 | .lll

sllabe

Copyright © 2002-2009 Telotone | verze 2.4 z 28/06/09