Vinyl - Dijital Master Farkları

'Müzik Genel' forumunda AwesomeTALHAwx tarafından 4 Eylül 2020 tarihinde açılan konu

  1. zxc

    zxc
    Expand Collapse
    Analog

    Katılım:
    4 Aralık 2013
    Mesaj:
    2,624
    Alınan Beğeniler:
    6,148
    "Orantının kırpılması" ne demek bilmiyorum.
     
  2. ziprar

    ziprar
    Expand Collapse
    FLAC

    Katılım:
    30 Aralık 2007
    Mesaj:
    444
    Alınan Beğeniler:
    143
    0-1 aralığını 10 eşit parçaya böldüğünüzde, ardışık 2 değer arası 1/10 artış oranı varken, sıkıştırılınca bu homojenlik bozulur ve artış oranları kısılır/kırpılır anlamında. Temelde bozuk, homojen olmayan bir koordinat ekseni ile çalışmak gibi (homojen bir eksen gerekirken tabii). Oranlar/orantılar bozulmuştur.

    Belki bir anlamda birşeye büyüteç tutmak gibi de düşünülebilir. Orta kısımlar nispeten büyük ve düzgünken, merceğin kenarlarına doğru görüntü bozulur. Öyle oluyordu galiba.
    --- Arka arkaya mesajlar birleştirildi, 15 Eylül 2020 ---
    Aslında oranlarda kırpılma deyip, artış oranı diye birşeyden bahsedince biraz garip duruyor, çünkü o artış miktarı. Eğer artış oranı olsaydı ardışık değerler çarpımsal şekilde (geometrik) artardı. Oysa artış aritmetik.

    Ama örneğin 5. değer ilk aralığın 5 katıdır, 6. değer 6 katıdır gibi düşününce (normal homojen durumda), bu oranlarda azalma/kırpılma oluyor (sıkıştırınca) gibi düşünülebilir.
     
  3. zxc

    zxc
    Expand Collapse
    Analog

    Katılım:
    4 Aralık 2013
    Mesaj:
    2,624
    Alınan Beğeniler:
    6,148
    Mercegin görüntüsünün bozulmasının sebepleri fiziksel ve bambaşka.

    Ancak sayı anlamında çözünürlük azalması için çözünürlüğün ciddi anlamda sınırlı olması gerekir. Ancak öyle değil, ve çözünürlük tamamen kontrolümüzde.

    Matematiksel anlamda çözünürlük zaten söz konusu değil. Bir çok insanın tahmin edeceğinin aksine, 0-1 arasındaki reel sayı miktarı, 0-2 arasındaki reel sayı miktarıyla birebir aynıdır. Hatta eksi sonsuz ile artı sonsuz arası sayı miktarı da aynıdır. Yani istediğiniz gibi sıkıştırın, aynı miktarda sayı sığar.

    Bilgisayarda tabii ki herşey sınırlı. Ancak machine zero tabir edilen çözünürlük 1.11x10^(-16). Yani farkedilebilecek seviyenin fersah fersah gerisinde. Farzı muhal farkedilebilecek seviyede olmuş olsaydı bile, 128bit sayı sistemi kullanılır yine çözülürdü.
     
  4. ziprar

    ziprar
    Expand Collapse
    FLAC

    Katılım:
    30 Aralık 2007
    Mesaj:
    444
    Alınan Beğeniler:
    143
    Ben çözünürlükten bahsetmedim aslında. Birşeye itiraz ediyor musunuz, yoksa sohbet modunda mı devam ediyoruz emin değilim. Veya birazdan "compression iyidir, kayıtlara çok şey katar" falan demeyeceğinizi umuyorum :)

    [0-1], [0-2], (-sonsuz, +sonsuz) reel sayı aralıkları (hatta complex sayı aralıkları veya isterseniz 3 boyutlu, 4 boyutlu, n boyutlu sayı aralıkları) dahi alef-bir, continuum (önce alef-sıfır yazmışım, o kesikli şeylerin sonsuzluğu (tam sayılar gibi). Alef-bir süreklilik içeren sonsuzluk). Hemfikiriz. (konuyla alakası olmasa da yazayım dedim)

    Ses olayında örneğin 16 bit kullanıldığında, integer sayılar mevzubahis. -32768 ile 32767 arasında. Burada çözünürlük değişmiyor, ses bilgisindeki homojen oranlar bozuluyor. Aslında fonsiyonu geri döndürmek isterseniz de bazan çözünürlükte 1 bit kayıp olabilir. Şöyle ki, 2 kat genişletip sonra geri döndüğünüzde aynı değere dönemeyebilirsiniz. 13/2=6, 12/2=6 hangisi olduğunu bilemeyecek.

    Ses yükseltme olayına girdiğinizde bu -32768 ile 32767 aralığındaki değerleri diyelim 1.5 veya 2 ile çarpmak zorunda kalıyorsunuz. Tabii değerler kendi taban ve tavan değerlerini aşıyor. Bu yüzden de yeniden map etmek zorundasınız aynı aralığa. O zaman da aralığın bazı yerleri genişlemiş bazı yerleri daralmış olacak (nonlinear olması bu yüzden zaten). Genişlemiş olacak çünkü sesi açtınız, daralacak çünkü aynı aralığa sığmak zorunda dönüştürülen değerler. Büyüteçte de benzer bir mantık olduğunu düşündüğüm için öyle yazdım. Aynı çerveve (bit düzeyi) içinde biryerleri genişletirken, kenarda bir yerleri bozuyor gibi geldi. Kenarda ayrıca renk kayması gibi olayları vardı hatırladığım kadarıyla. Mantık benzer geldi. Ama siz çok güzel açıklamışsınız bambaşka diyerek. Aklıma yattı.

    Machine zero, kuantum minimum mesafe mi?
    --- Arka arkaya mesajlar birleştirildi, 15 Eylül 2020 ---
    Yazılanları tekrar okuduğumda, sanırım siz sayılar, onların sıkışması, çözünürlüğü vs ile ilgili genel sorunlarım/çıkmazlarım olduğunu düşündünüz.

    Ben hala ses olayını örnekliyordum oysa. Sadece aralıklarla oynuyorum, ve noktalı sayı olmamasına rağmen belli bir noktayı örneklerken onu kullanmış olabiliyorum. Yoksa ana olay hala ses verisi ile ilgili. Genel olarak sayılarla bir derdim yok.
    --- Arka arkaya mesajlar birleştirildi, 15 Eylül 2020 ---
    Bir insanın sayılarla ne gibi bir sorunu olabilir ki zaten :)

    Aklıma Cem Yılmaz'ın havuz problemi diyaloğu geliyor.

    - Oğlum gir havuza
    - I ıh. Problem çıkarabilir
     
    #24 ziprar, 15 Eylül 2020
    Son düzenleme: 15 Eylül 2020
  5. zxc

    zxc
    Expand Collapse
    Analog

    Katılım:
    4 Aralık 2013
    Mesaj:
    2,624
    Alınan Beğeniler:
    6,148
    Belli ki konu hakkındaki birikimlerimiz farklı olduğu için verimli iletişim gerçekleştirmekte zorlanıyoruz. Dynamic compression tabii ki dikey eksende belli aralıkların esnetilmesi, bazı aralıkların da sıkıştırılmasına dayanıyor.

    Bunun geri alınmasında kayıp oluşup oluşmaması ise tamamen kullanılan reprezentasyonun çözünürlüğüyle alakalı. Çözünürlük sonsuzsa, yani reel sayılarla çalışıyorsanız, kayıp söz konusu olamaz. Bilgisayar ortamında bu tabii ki mümkün değil.
    Ancak 16-bit sayı sisteminin sağladığı çözünürlük, tipik dynamic compression eğrisini geri alabilmek için fazlasıyla yeterli çözünürlük sunmakta.

    Machine zero, bilgisayarda kullanılan bir sayı sisteminin çözünürlüğüdür. Bilgisayarin 1 ile 1+a arasında ayırdedebileceği minimum a değeridir. Ancak bu a değeri, o sayı sisteminin ifade edebileceği en küçük değerden çok daha yüksektir. Çünkü sayıları integer değil, floating point sayı sistemi ile gösteriyoruz. Tüm modern DSP'ler de floating point arithmetic kullanıyorlar benim bildiğim. Headroom da aşırı yüksek, yani bahsettiğiniz kırpmanın, yani "clipping"in olması çok mümkün değil. Sesi yarıya indirdiğinizde de kayıp yok gibi birşey. Muhtemelen hâlâ integer mantığıyla düşünüyorsunuz.
     
  6. ziprar

    ziprar
    Expand Collapse
    FLAC

    Katılım:
    30 Aralık 2007
    Mesaj:
    444
    Alınan Beğeniler:
    143
    Sanırım anladım. Aynı şeyden bahsetmiyoruz. Birikimden çok, neyden sözettiğimizi netleştirmememizle alakalı gibi.

    Ben 'compression'dan bahsediyorum. Siz 'compression'ın geri döndürülebilir olması' olayından bahsediyorsunuz. Ben sıkıştırmanın geri döndürülebilir olduğunu kabul ettim ve o konu benim kafamda bitti. Ama 'kırpma' sözünü kullanınca (oranların kırpılması) veya homojenlik bozuldu deyince siz 'geri döndürülemezliğe' atıfta bulunduğumu düşünüyorsunuz. Siz karşı çıkınca da ben, "compression'da bir sorun yoktur" diyorsunuz gibi algılayıp, compression'ı biraz daha anlatmaya çalışıyorum. Ama esas tuzak o ki, yazıların bir yerinde "işte 1 bit kayıp olabilir geri dönüştürürken" gibi laflar geçtiği için (ki üzerinde çok düşünülmüş şeyler değil, çünkü konu esas olarak o değil bana göre), siz sayı sistemlerine giriyorsunuz falan... İşte öyle, sonra kan ter içinde uyanmışım :)

    Sanırım compression'ın sorunlarına dair aramızda bir sorun yok. Homojenliğin ve oranların (geri döndürülebilir olarak) bozulduğunda hemfikiriz. Tamsayı yuvarlatma mevzusu da önemli değil. Aramızda 1 bitin lafı olmaz.

    ---

    Deyip esas sürprize geçeceğim. Bu sefer geri döndürülemezlik ve sayı sistemleri ile ilgili yazacağım. Ama buraya kadarı üzerinde anlaşmadan yazmaya korkuyorum. Önce bu noktaya kadar anlaşalım.
     
  7. zxc

    zxc
    Expand Collapse
    Analog

    Katılım:
    4 Aralık 2013
    Mesaj:
    2,624
    Alınan Beğeniler:
    6,148
    Homojenlik ve oran genel tabirler olduğu için kullanmaktan çekinmekle beraber, dynamic compression dahil herhangi bir nonlineer transformasyonun noktalar arasındaki mesafe ilişkilerini koruyamayacağını rahatlıkla söyleyebiliriz.
     
  8. ziprar

    ziprar
    Expand Collapse
    FLAC

    Katılım:
    30 Aralık 2007
    Mesaj:
    444
    Alınan Beğeniler:
    143
    O halde farklı şeylere odaklandığımız konusunda beni onayladığınızı varsayarak devam ediyorum (aslında sizde çok fazla suç olduğu da söylenemez, çünkü kırpma terimi geri döndürülemezliği çağrıştırıyor).

    Öte yandan bence verimli bir iletişim oldu. İletişimde birşeyler karışmazsa iletişim kolay olur, ama karışırsa da onu çözmek bize yeni bir deneyim ve gelişme aracı olur. Yani hertürlü kârdayız.

    ---

    Sayı sistemlerinden sözetmekten biraz vazgeçtim, çünkü çok ilgili değil gibi. Ancak farklı bit uzunluklarında floating point formatlar sözkonusu. 10^-16 gibi bir sınır bilmiyorum. 64 bit floating format 10 ^ -+300 falan taşıyabiliyordu üs kısmında, mantis kısmında da 15-16 dijit hassasiyeti vardı. Hatta sınırlı olmayan sayıda dijit içerebilen türler de mevcut. Neyse bu konu çok önemli değil.

    ---

    Geri döndürülemezlik konusunda ise, tekrar en baştaki gibi geri döndürülemeyeceğine inanmaya başladım. Sürpriz bu idi.

    Örnekle açıklamak istiyorum. Ama öncelikle kayıtlar (kayıt dosyaları) integer, DAC'lar da integerlar üzerinden işlem (dijitalden analoga dönüşüm) yapıyor. Yani konu tamsayılar üzerinden dönmek zorunda. DSP için ara aşamaların floating sayılar üzerinden çalışabilmesi çok birşey ifade etmiyor. Onlar ara işlemlerdeki gereksiz hassasiyet kayıplarını önlemek için. En son gene 'integer bazlı' bir kayıt/dosya sistemi ve DAC gerekecek.

    Siz bunu da göze alıp zaten 16 bit'te bu geri döndürebilme işlemlerini karşılayabilecek kadar derinlik var demişsiniz. O yüzden örneğimle devam ediyorum.

    Örnek tabii daha kolay anlaşılması için küçük bir örnek olacak. Diyelim ki, [-32768, 32767] aralığı yerine elimizde [1,10] dikey aralığı var. Ben de bu değerleri 2 ile çarpmak istiyorum. Tabii sonra gene aynı aralığa map edeceğim. Bunun için bir mantık kurmam gerek. Çarpmadan dolayı bazı yerler genişleyecek, aynı aralığa sığdırma zorunluluğundan dolayı da bazı yerler daralacak/sıkışacak.

    1,2,3,4 -> 2,4,6,8 : Burası genişleyen aralık. Yani fonksiyonumuzun değerleri 2 ile çarptığı aralık.

    Şu noktada 8'e kadar olan değerleri işgal ettik. Daha önce her değer kendi koltuğunda oturuyordu, fonksiyon dönüştürünce 1,2,3,4 kalktılar ve 2,4,6,8 koltuklarına oturdular.

    Geriye kaldı 5,6,7,8,9,10. Bunlar için kalan koltuk sayısı ise 2. Yani şöyle yapabiliriz;
    5,6,7 -> 9 ve 8,9,10 -> 10

    İşte bu noktada da birebir oluş bozuldu. Fonksiyonu (tam olarak) geri döndüremeyiz çünkü 9'u geri döndürürken 5 mi, 6 mı, 7'ye mi döndüreceğimizi bilemeyiz.

    Bu sorun örneğin küçük olmasından kaynaklanmıyor. 16 bit (veya 24, 32 farketmez) tam aralıkta yapsanız da aynı sorunla karşılaşırsınız. Çünkü 'genişleyen kısımda' bazı koltukları atlıyorsunuz, onlar boş kalıyor (boş ve tekrar kullanılamaz). Dolayısı ile 'daralan kısımda', bir koltuğa birden çok nesne oturtmak zorunda kalacaksınız.

    Reel sayı olsaydı kurtarabilirdi belki (gerçi bilgisayarda gerçek bir reel sayı da yok ve olamaz. Çünkü bir reel sayının derinliği sonsuza kadar gidebilir), ama tamsayılarla kurtarmıyor birebir oluş.
     
  9. zxc

    zxc
    Expand Collapse
    Analog

    Katılım:
    4 Aralık 2013
    Mesaj:
    2,624
    Alınan Beğeniler:
    6,148
    Evet, veri (16bit integer ses sinyali) discrete. Ancak transformasyon (dynamic compression curve and its inverse) continuous. Bu ayrım neden önemli?

    Çünkü direk 16 bit integer sinyal üzerinde çalışmıyoruz. Elimizdeki transformed 16bit integer sinyali, her modern DSP'nin yaptığı gibi 32 bit floating point sinyalle interpolate edip ters transformasyonu uyguladığımızda muhtemelen orijinal sinyali birebir elde edebiliriz.

    Gerçi dithering dahil sürüyle uygulanan etkinin tümünü geri almak mümkün değil, ancak dynamic compression gibi yumuşak ve düzenli bir transformasyon, ciddi bir veri kaybı sebebi kesinlikle değil.
     
    #29 zxc, 16 Eylül 2020
    Son düzenleme: 16 Eylül 2020
  10. ziprar

    ziprar
    Expand Collapse
    FLAC

    Katılım:
    30 Aralık 2007
    Mesaj:
    444
    Alınan Beğeniler:
    143
    Hocam enterpolasyon falan bizi bozar. Bunlar tahmin araçları, kesinlik değil. Ona bakarsanız 16 biti, 24 bite çeviririm diyen algoritmalar da var.

    Aslında en güzeli şu, bilir misiniz eskiden 8 bit makinalar vardı ve onların 8 bit müzikleri vardı. Onlardan birini vereceksiniz bu 'ben bit yükseltirim' diyen algoritmalara, önce 16 bite, sonra da 24'e yükseltsin, bakalım ne çıkacak.

    Pek birşey çıkmaz. Biz 16 bit zaten güzel, 24 bite çevirdim deyince aradaki farkı pek anlayamıyoruz da, o yüzden algoritmanın birşeyler başarmış olduğunu sanma eğilimine giriyoruz (başarılı olmuş olma olasılığını seviyoruz). 8 bitten 16 bite dönüştürünce ak koyun, kara koyun ortaya çıkacak. Çünkü 8 bit ilkel bir müzik. Ve hala ilkel kalacak.

    Ki ses dalgası çok inişli çıkışlı birşey. Ara değer hesaplamanın en çok çuvallayacağı türde birşey yani. Bundan da en çok tiz frekanslar zarar görür sanırım. Çünkü 44.1 kHz bir müzik için örneğin; 40000 örnekleme frekansı, 20000 Hertzlik bir ses için ancak (ucu ucuna) yetiyor. Yani yukarıda bir nokta ve hemen sonra aşağıda bir nokta diye devam edip gidiyor (sadece tepe ve çukur noktalarıyla tanımlı sinüs eğrisi ya da zikzakı gibi birşey). Yani o yukarıdaki noktanın ne kadar yukarıda olduğunu söylemek pek mümkün değil (x?, x+1?, x+2? veya x+3?). Resmen kafadan atacak.

    Veri kaybı ne kadar ciddi olur. Genişleyen ve sıkışan alanların büyüklüğüne bağlı. Sıkışan alanda 2 değer üstüste binerse o veride 1 bit hassasiyet gider. 4 değer üstüste binerse 2 bit hassasiyet gider. Gider ve geri gelmez.

    Bu ciddi bir veri kaybı mıdır. Belki değildir, belki de öyledir. Her bit hassasiyeti yarıya düşürür.

    Ama tamsayılarda fonksiyon geri alınamaz temel olarak. Kayıplı (veya tahminli) olarak alınabilir.
     
    #30 ziprar, 16 Eylül 2020
    Son düzenleme: 16 Eylül 2020
  11. zxc

    zxc
    Expand Collapse
    Analog

    Katılım:
    4 Aralık 2013
    Mesaj:
    2,624
    Alınan Beğeniler:
    6,148
    Dynamic compression'da gerekli interpolasyon time domain'inde değil, amplitude domain'inde. Transformasyon zamandan tamamen bağımsız. Yüksek ve düşük frekansların tümüne etkisi aynı.

    Time domain'de oversampling yaparak olmayan ses verisi ekleme söz konusu değil. Amaç dynamic compression transformasyonunun smoothness'ını exploit etmek.
     
  12. ziprar

    ziprar
    Expand Collapse
    FLAC

    Katılım:
    30 Aralık 2007
    Mesaj:
    444
    Alınan Beğeniler:
    143
    Ben de time domain'inde diye düşünmedim zaten. Yeni veri eklenmiyor, mevcut verilerin yerlerinin uygunluğu araştırılıyor. Ama yukarıda yazdıklarım aynı kalıyor.

    Tahminleme temelde mevcut veriden matematiksel bir model kurup, bundan sapmaları gözlemlemek gibi düşünülebilir. Tiz frekanslar için elde daha az veri var.

    Ki ses dediğimiz şey matematiksel modellere uysaydı, o kadar ses verisini tutmaya hiç gerek kalmazdı. Sentetik ses üreticilerinin sesleri de gerçekleri kadar iyi olurdu.
     
  13. zxc

    zxc
    Expand Collapse
    Analog

    Katılım:
    4 Aralık 2013
    Mesaj:
    2,624
    Alınan Beğeniler:
    6,148
    @ziprar, cok basit oldugu icin direk verdigin ornege benzer bir ornek verecegim. Matlab varsa yazdiklarimi aynen tekrarlayabilirsin.

    Orijinal ses dosyasi verisi:
    >> x=0:16
    x =
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
    Agresif sayilabilecek bir dynamic compression transformasyonu uygulayalim:
    >> y=round(sqrt(16*x))
    y =
    0 4 6 7 8 9 10 11 11 12 13 13 14 14 15 15 16
    Yukarida bahsettigin durum olustu sonda degil mi? Mesela 14 ve 15'in ikisi de 15'e gitti.
    Simdi ters transformasyonu uygulayip orijinalini elde etmeye calisalim:
    >> z=round(y.^2/16)
    z =
    0 1 2 3 4 5 6 8 8 9 11 11 12 12 14 14 16
    Ilk basi duzgun ama sona dogru bahsettigin kayip sorunu mevcut. Ayni degerler ters transformasyonla ayni degerlere denk geldi, bu da orijinal veriden farkli.

    Ama simdi de eldeki compressed veriyi once smooth'lastirip, sonra ters transformasyon uygulamayi deneyelim. Once veriyi Hodrick-Prescott filter'indan gecirip smoothlastiralim:
    >> yy=(hpfilter(y,1))'
    yy =
    0.6323 3.4375 5.6104 7.0811 8.1693 9.1139 9.9840 10.7353 11.3391 12.0315 12.7096 13.2387 13.7749 14.2353 14.7623 15.2629 15.8818
    Artik tam sayi kullanmiyoruz. Ve simdi bu smooth dataya ters transformasyonu uygulayip round edelim bakalim ne cikacak?
    >> zz=round(yy.^2/16)
    zz =
    0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
    Orijinalin aynisi!!!!

    Nasil olusan kaybi geri aldik? Cunku dynamic compression transformasyonu cok smooth bir transformasyon. Dolayisiyla herhangi bir smoothing algorithm'i kullanarak, olusmus gibi gorunen kaybi onlemek mumkun. Anlasilmayan kisim varsa yardimci olmaya calisirim.
     
    #33 zxc, 16 Eylül 2020
    Son düzenleme: 16 Eylül 2020
  14. AwesomeTALHAwx

    AwesomeTALHAwx
    Expand Collapse
    Yeni Üye

    Katılım:
    13 Eylül 2019
    Mesaj:
    17
    Alınan Beğeniler:
    1
    Vinyl masterlar açık ki farklı yapılmış. Audacity üzerinden ölçtüğümde çok kaliteli bir plak ripi yaklaşık 22 db dinamik aralığa sahipken aynı şarkının dijital versiyonunda 10 db çıktı. Tabii bunlar ortalama değer sanırım. Bu plaktan dijitale aktarılmış kayıtta tüm şarkıyı değil de belli bölgeleri seçtiğimde kimisinde 20db kimisinde 30+ db dinamik aralık çıktı, detayları siz daha iyi bilirsiniz.
    Ancak MQA farkediyor gibi görünüyor, şu linkten: https://drive.google.com/file/d/1EbkyefjStxMb0oihJZNe4BimIglEWm5z/view?usp=sharing göreceğiniz üzre (üstteki MQA alttaki standart kayıpsız) üstteki kırpılmamış gözüken ve yer yer pikleri amplifikasyon barının tepesine varan, daha doğal bir dalga izleniminde. Master'lar gene dijital ve plak için farklıdır ama MQA, ses şiddetinin eşitlenmesi için standart dijital yayına kırpılarak gönderilen (yani belli sınırlamalara ve standartlara uydurulan) halinden farklı olarak daha aslında uygun görünüyor. 'the way that artist intended to create' sloganı tamamen boş değil.
    Elimdeki başka bir parçada da 24 bit standart olan, pik noktaları eşit gözüken (veya kırpılmış), üstten 1 db şiddeti azaltılmış iken, MQA olan üstte tariflediğim gibi bir dalga grafiği izliyordu.
    Ayrıca MQA olan ile normal olanı birbirine sönümlettiğimizde (birinin dalgalarını ters çevirip birlikte oynattığımızda) arada hatırı sayılır bir fark oluşuyor.
     
    #34 AwesomeTALHAwx, 16 Eylül 2020
    Son düzenleme: 16 Eylül 2020
  15. ziprar

    ziprar
    Expand Collapse
    FLAC

    Katılım:
    30 Aralık 2007
    Mesaj:
    444
    Alınan Beğeniler:
    143
    Zxc,

    Orijinal ses verisi olarak verdiğin değerler, fazla düz, lineer, tahmin edilebilir. Ben biraz şenlendirmek için o satırı şöyle değiştirdim;
    x=0:16
    satırı yerine
    x=[0,5,9,12,3,8,6,9,1,12,7,5,4,4,5,9,16]

    Sonuç ise şöyle oldu;

    yy=(hpfilter(y,1))'
    2.0372 7.4871 10.8998 11.7509 10.6162 10.3207 10.0733 9.7620 9.2015 10.4445 10.3425 9.3022 8.3878 8.3613 9.5968 12.1073 15.3089

    zz=round(yy.^2/16)
    0 4 7 9 7 7 6 6 5 7 7 5 4 4 6 9 15

    Yani pek alakası yok orijinal veri ile.

    Hatta şansa smoothlaştırılmamış olan daha iyi idi.

    z=round(y.^2/16)
    0 5 9 12 3 8 6 9 1 12 8 5 4 4 5 9 16
     
  16. zxc

    zxc
    Expand Collapse
    Analog

    Katılım:
    4 Aralık 2013
    Mesaj:
    2,624
    Alınan Beğeniler:
    6,148
    Daha once hic HP-Filter kullanmadiniz diye tahmin ediyorum... :)

    Deli gibi osilasyon yapan ve insan kulaginin duyma sinirina yakin yuksek frekanslari ornekleyen bir veri icin bu kadar yuksek degerde bir smoothing uygulamak sinyali bozmaktan baska bir is yapmaz tabii ki. Onun icin HP-filter frekansla ters orantili kullanilmak uzere tasarlanmis bir smoothing parameter icerir, yani sizin degistirmediginiz "1" degeri.

    Onun icin verdiginiz yuksek frekansli sinyalde hic bir smoothing uygulamadan bile ters transformasyon aldigimizda sadece biri disinda tum orijinal degerleri elde edebiliyorsunuz. Yani aslinda benim verdigim ornek daha zorlu bir ornekti. O tek degeri duzgun recover etmek icin de HP filter'i time domaininde genisletmek gerek ki dusuk degerli smoothing icin gerekli alan olussun. O kod ise interpolasyon bazli oversampling gerektirdigi icin ornek yazmaya vaktim ve motivasyonum yok acikcasi... Ancak bu islem sonrasi ayni mantikla orijinal sinyali elde edebilirsiniz...
     
  17. mavi

    mavi
    Expand Collapse
    FLAC

    Katılım:
    6 Temmuz 2013
    Mesaj:
    237
    Alınan Beğeniler:
    1,468
    Konuya bir süre sonra yeniden bakınca bir "vay anam vay neler dönmüş" dedim.

    Bu kadar teorik tartışma sonrası, okuyan arkadaşlara yardımcı olabileceğini umarak doğrudan kendi pratik tecrübemden birkaç şey paylaşayım :

    a) Yüksek çözünürlüklü dijital kayıt teknolojilerini (24 - 32 bit, DSD vs) bir yana bırakıyorum, 16 bit standart CD (Redbook audio) kalitesi dahi, teknik değerler açısından plaktan belirgin ve kulakla duyulabilir biçimde üstündür.
    Burada örneğin frekans aralığı, sinyal gürültü oranı ve stereofonik kayıt başarımı gibi parametrelerden bahsediyorum. Örneğin bir plak kayıt, üst tiz ve alt baslarda "yuvarlama" dediğimiz (ve sese hafif bir analog hava katan) akustik davranışı gösterirken, muadili olan 16 bit'lik standart bir cd kaydı 20 Hz- 20.000 Hz arası ses sinyalini muntazam biçimde saklayıp iletme becerisine sahiptir.

    Başka bir ifadeyle plakta en alt ve en üst frekanslar törpülenir.

    CD kalitesinin plağa karşı diğer bir üstünlüğü olarak belirgin ölçüde daha yüksek bir sinyal / gürültü oranı sunması gösterilebilir. Bu manada, daha az gürültü ve dip ses duyarsınız ; plağa göre CD (daha dijital de olsa) bir berraklık & ses temizliği artısı hissiyatı uyandırır.
    CD teknolojisinin bu üstünlüğü sayesinde, 1980'lerde bu teknolojiyi bize sunan Sony ve Philips CD ile "sessizliğin dahi kaydedilebileceği" gibi bir iddiada bulunmuşlardır. Zira CD, öncülü olan (plak ve kaset gibi) analog / manyetik kayıt teknolojilerine nazaran teorik olarak çok daha düşük bir gürültü zemini sunabilmektedir.

    b) "Dijital" müzik teknik olarak plaktan ciddi ölçüde üstün olmasına rağmen neden 2020 yılında hala plak topluyoruz veya neden daha genel bir soru olarak, kaset tarihe karışmışken plak neden hala var ve ilgi görüyor?

    Basit cevap : Dijital kayıt teknolojileri bir plağın ürettiği ses belki de hiçbir zaman ulaşamayacak da ondan.

    Dijital müzik kaydının - bütün o teknik ihtişamına rağmen - temel sorunu ismindedir ; dijital olmasındadır.
    Daha geniş olarak anlatayım.
    Buradaki temel sorun, bir enstrümanın üretmiş olduğu analog ses sinyallerinin belirli metotlar ve algoritmalar eşliğinde 1 ve 0'lar ile modellenmesi ; yani müziğin kendisinin değil, daha ziyade bir "suret"inin kaydedilmesidir. Ve bu kayıt yapılırken analog ses sinyallerinin dijital değerlerle ifade edilmesi durumunda her halükarda bir sadakat (fidelty) kaybı olur.

    Bunu gündelik hayatta pek fark etmiyoruz belki, zira artık her yerde dijital müzik var.
    Lakin iyi bir plakçalar sisteminden örneğin ağır, kaliteli bir ilk basım plağı dinleyip akabinde aynı kaydın CD versiyonunu dinlediğinizde "seste bir şeylerin eksildiğini" hissedersiniz (Bu satırların yazarı, binlerce dolarlık pek çok üst seviye dijital sistemden müzik dinlemesine rağmen, en doğal ve gerçekçi enstrüman tasvirini bir plakçalardan duydu).

    c) Plağın CD'ye karşı geçmişte de bazı açılardan üstünlüğü vardı ; lakin 90'ların başıyla birlikte müzik prodüktörlerinin dinleyici kitlesini daha yüksek sesli müzikle bir nevi "kandırmayı" keşfetmeleri ile birlikte "Loudness Wars" denen şey başladı ve bu durum o dönemden sonra üretilen CD kayıtlarının kalitesine yansıdı.
    Biraz şaşırtıcı gelebilir, ama 80lerdeki popüler müzik içeren CD kayıtlarının (örneğin kayıt ve mikrofon teknolojisindeki gelişmelere rağmen) günümüzdekilerden çoğu zaman daha düşük ses kalitesine sahip olmaları bununla alakalı.

    Bununla alakalı olarak buraya okuyan arkadaşlara eski albümlerin "remaster" versiyonlarına kuşkuyla yaklaşmalarını tavsiye edebilirim.
    Zira nadiren tüm kaydın elden geçmiş ve sıfırdan analog / dijital tape'lerden temiz bir kayıt ortaya çıkarılmış olduğu durumlara rastlıyorsunuz. Çok zaman ise müzik firmaları kolaya kaçıp albümlerin ses seviyelerini yükseltmekteler.

    Dynamic Range Compression (Dinamik Aralık Sıkıştırması) her zaman kötü müdür?

    Hayır.
    Örneğin doğal dinamik aralık değeri (Dynamic Range value - kısaca DR value) 19 olan bir kaydın dinamik aralığı, biraz maharetli bir prodüktör elinde 11 - 12'ye düşürülürse (bu değer şarkıya göre değişir) dinleyen kişi ihtimal dahilinde herhangi bir eksiklik duymayacaktır. Daft Punk'ın 2013 albümü Random Access Memories 8 DR değerine sahip, sıkıştırılma görmüş, başka bir ifadeyle "loudness procedure" uygulanmış bir albüm olmasına rağmen genel ses kalitesi olarak başarılıdır.

    Dolayısıyla burada önemli olan, bir albüme sıkıştırma uygulamamak değil, bunu dinleyiciye hissettirmeyecek ölçüde müzik kaydının aslına sadık kalacak biçimde yapmaktır.

    d) Vinyl-rip kayıtlar tüm bu tablonun neresinde duruyor? Kullanılmaları makul mü?

    Bu kayıtlar, plaklardan ADC'ler (Analog-to-digital converter - yani bir anlamda DAC'in tersi) ve bazı kayıt programları ile oluşturuluyorlar.
    Yani sonuç olarak, dijitale çevrilmiş & bir dönüştürmeden geçmiş oldukları için plağın "tamamıyla analog" olabilme avantajına sahip değiller. Öte yandan, vinyl-rip'lerin başarısı, evinde / stüdyosunda bunu yapan dinleyicinin mahareti ile elindeki ekipmanların ve plağın kalitesine göre fazlasıyla değişebiliyor.

    Örneğin şu ana kadar aynı albümün, farklı kişilerce yapılmış ve aralarında dağlar kadar kalite farkı olan vinyl-rip versiyonlarına denk geldim. Dolayısıyla burada biraz şans faktörü var.

    Diğer taraftan, iyi kotarılmış bir vinyl-ripping, bir albümün cd versiyonunun yerini hayli hayli tutabilir.

    Özellikle sorunlu prodüksiyonlara sahip dijital albümlerin yerine aynı albümlerin vinyl-rip versiyonlarına bakılabilir.
    Şu anda internette, "malum yollarla" pek çok yabancı albümün 24 bit'lik plak versiyonu bulunabiliyor ; bunların arasında ses kalitesi çok iyi olanlar da var.

    Benim için bir albümü indirmeden önce her zaman baktığım, başucu kaynağım olarak Dinamik Aralık Veritabanı (Dynamic Range Database) sitesinin link'ini de buraya bırakayım, belki işine yarayan olur :

    http://dr.loudness-war.info/
     
    fortress34 bunu beğendi.
  18. ziprar

    ziprar
    Expand Collapse
    FLAC

    Katılım:
    30 Aralık 2007
    Mesaj:
    444
    Alınan Beğeniler:
    143
    Örneği uygun düzenlemek sizin sorumluluğunuz diye düşünüyorum. HP-filter'deki smoothing faktörünü 'case bazında' uygun belirlemek için bile algoritmalar var. Yani 2. kademe belirsizlik (belirsizliğin belirsizliği).

    Zaten kesinlik metodları ile yakınsama metodları çok farklı çalışır. Birbirlerinin yerine geçebilme iddiasında değillerdir. "Ben yakınsarım ama çok iyi yakınsarım, herzaman tam üstüne yakınsarım" diyen metod mevcut değildir.

    ---

    Bu arada ben gerçek değerleri geri getirmenin imkansız olduğuna ikna oldum, birazdan anlatacağım. Dönüşüm ne kadar smooth olursa olsun veya hangi algoritmayı kullanırsanız kullanın.

    Şöyle söyleyeyim, ben bu sayıları kafadan attım (gerçekte ses verileri de bunlara benziyor zaten). Aralarında hiçbir ilişki, model, kalıp yok. Sizin gerçek sayıları döndürürüm iddianız aslında "aklınızdan tutacağınız bir sonraki sayıyı bilen algoritma yazdım" iddiasıyla eşdüzeyde.

    Tabii diyeceksiniz ki, bu durumda elimde hiçbirşey yok değil, Compression'ın sonucu olan sayılar var. O yüzden ben de şöyle bir mizansen kurguluyorum.

    Size verdiğim dönüşmüş sayılar;
    y = 0 9 12 14 7 11 10 12 4 14 11 9 8 8 9 12 16
    olsun. Son verdiğim örnekten devam ediyorum.

    Bu dönüşüm fonksiyonu için aynı koltuğa götüren değerler
    7,8 -> 11
    10,11 -> 13
    12,13 -> 14
    14,15 -> 15

    Yani y'de 11,13,14,15 değerleri geri dönüştürürken sıkıntılı.
    Bizde 11 var sorun çıkarabilecek. Çıkarttıralım.

    Bu sayıları ben örneğin
    x1 = 0 5 9 12 3 8 6 9 1 12 7 5 4 4 5 9 16
    veya
    x2 = 0 5 9 12 3 8 6 9 1 12 8 5 4 4 5 9 16
    orijinal ses verisinden üretebilirdim. Yani ben size y'yi veriyorum. Ve kaynak x1 de, x2 de olabilirdi.

    Şimdi ilginç noktaya geliyoruz. Ben kaynağın ne olduğunu baştan seçmek, belirlemek zorunda bile değilim.
    Bilmek zorunda değilim.

    Bu sayede de siz kaynak x2 diye bir sonuç ürettiğinizde; "hayır x1 idi" (çünkü x1'i seçmiş olabilirdim), veya x1 dediğinizde de "hayır x2 idi" (çünkü x2'yi seçmiş olabilirdim) deme şansına sahibim. (henüz açılmamış Schrodinger'in kedisi kutusu gibi oldu sanki)

    Yani aslında, orijinal veriyi yarattığım halde, benim bile bilmediğim bir sayıyı tahmin etmeye çalışır duruma düşüyorsunuz. Ki bu imkansız.
     
    #38 ziprar, 17 Eylül 2020
    Son düzenleme: 17 Eylül 2020
  19. AwesomeTALHAwx

    AwesomeTALHAwx
    Expand Collapse
    Yeni Üye

    Katılım:
    13 Eylül 2019
    Mesaj:
    17
    Alınan Beğeniler:
    1
    mavi,
    Yanıtınız ve bilgilendirmeniz için teşekkür ederim. Ben hem Vinyl için hem de dijitale yapılmış iki farklı mastering'i sevdiğimden bulabilirsem plaktan riplemeleri arşivime katıyorum. Özellikle dinamik aralığın daha geniş olması ve ses tınısının belki biraz daha farklı olması sebebiyle aynı albümün farklı bir versiyonu olarak elimde bulunur. İkisinin de ayrı bir tadı vardır.
    -Analog Kayıt ile Dijital kaydın arasında pek bir fark olmaması gerekmiyor mu?
    -Günümüzün yüksek kalite kayıt cihazları zaten hedeflenen/seçilen frekans bandı aralığını kayıpsız bir şekilde dijitalleştirmiyor mu?
    -Ve Dijitalden Analoğa dönüştürücüler (kaliteli bir tanesi kullanılıyorsa) ne kadar kayba sebebiyet verir ki?
    Plaktan dinlediğiniz enstrümanın daha doğal geldiğini söylemiştiniz, bu nasıl olabilir? Eğer plaktaki doğal ses mastering sürecinden kaynaklanıyorsa, çok kaliteli bir plak ripini sistemimde dinlediğimde aynı o tadı ben de alabiliyorum. Bu konuda analoğun kayda değer bir üstünlüğü noktasında ikna olamadım. Veya günümüz 'analog to digital' ve 'digital to analog' dönüşüm süreçlerinin verimliliği ile ilgili eksik bilgim var.
    --- Arka arkaya mesajlar birleştirildi, 17 Eylül 2020 ---
    bildirim
     
  20. zxc

    zxc
    Expand Collapse
    Analog

    Katılım:
    4 Aralık 2013
    Mesaj:
    2,624
    Alınan Beğeniler:
    6,148
    Bu doğru değil. Müzik dinliyoruz sonuçta, white noise değil. Uydurduğunuz kısım çoğumuzun duyabileceği frekansların limitine yakın, 10KHz-20KHz arası. Enstrüman ve vokal sıfır, ve onların verisi verdiğim örnekten yüzlerce kat daha düzgün.

    Problem, müzik üzerinde değil, rastgele uydurulmuş rakamlar üzerinden yorum yapıyor olmamızda. Recovered ses ile orijinal arasında fark duyulup duyulmadigi asıl sorun.

    Ek olarak tam recovery zaten pratikte uygulanan dithering yüzünden mümkün değil. Bu arada "orijinal ses" dediğiniz veri de capture'dan mastering'e kadar quantization, dithering, truncation dahil gırla hata içermekte zaten.

    Bir de ikimiz de ses mühendisi olmadığımız için direk sinyal üzerinde çalışıyoruz. Halbuki herşeyin çok daha düzgün olduğu frequency domain de çalışmamız lazım.
     
    #40 zxc, 17 Eylül 2020
    Son düzenleme: 17 Eylül 2020