מילא 24bit, אבל 96KHz? 145756
הפורמט הזה, אם אכן יצליח, לא יעשה זאת בזכות האיכות שלו, אלא בזכות הפרסום לו זכה. מרחב דינמי של 24bit אכן מועיל מאד (כבר כיום משתמשים ב-‏24 כאשר מעבדים את השירים לפני הורדתם ל-‏16 ב-CD רגיל, ולדבר יתרונות רבים). אבל 96KHz הוא כבר מיותר לחלוטין - גם 48KHz מספיק (פורמט קיים כיום, להבדיל מ-‏44.1KHz של ה-CD הנוכחי). בזבוז נוראי של מקום.
באשר לסאונד היקפי וכו': מי שישתמש ברמקולים היקפיים הנפוצים כיום להאזנה ל-DVD יזכה לחוויה מוסיקלית מפוקפקת למדי. כדי להאזין למוסיקה רב-ערוצית כהלכתה צריך ארבעה רמקולים *זהים* ולעתים גם סב-וופר. ודאי לא הצ'יקמוקים העלובים שנמכרים כיום בתור רמקולי סראונד.
גם מגברי הערוצים של היום לא ממש מתוכננים להעברת מוסיקה רב ערוצית באמת. הגישה הנוכחית היא "סטראו+אפקטים", להבדיל מ"רב ערוצי מלא" (4-7 ערוצים).
כל זה לא יפריע לחברות למכור לכם פטנטים מפוקפקים ואופנתיים מאד, כמובן. אני חוזה פופולאריות רבה למוצרים הנ"ל. למרבה הצער.
מילא 24bit, אבל 96KHz? 145760
ומה אם המוזיקה הרב-ערוצית *תוכננה* לשני רמקולים צדדיים, רמקול מרכזי, ושני רמקולים אחוריים קטנים/חלשים יותר? נדמה לי שבזאת אנו עוסקים.
מבנה זה הוא הנצחה של גישת הסטראו+FX. 145761
הוא לא מוסיקה רב-ערוצית אמיתית. בדיוק כפי שבמוסיקה סטראופונית אמיתית לא יעלה על דעתך לקנות רמקול שונה לכל צד. במצב הקיים כיום, תחום התדרים של הרמקולים "האחוריים" מוגבל, וכתוצאה לא ניתן להגיע למיצוי מלא של ריבוי הערוצים. ביחוד אמור הדבר ביצירות חדשות, שיסתמכו (אולי) על הפורמט החדש. לדוגמה, נניח שהיוצר רוצה שכלי מסוים ינוע במרחב הדמיוני. כיום, בסטראו, הוא מזיז את בקרת ה-Panning לאחד הצדדים, מתוך ידיעה ברורה שהצליל ישאר זהה במהותו בשני רמקולי הסטראו. אך מה יקרה כאשר הוא ינסה לעשות את אותו דבר בציר קדימה-אחורה במערכת היקפית קיימת? צליל הכלי ישתנה באופן לא טבעי, בדרך כלל גם לא מחמיא. כמובן שאין כל דרך לפצות על כך באולפן - אין ליוצר כל דרך לדעת אילו רמקולים יש לך בבית. הדבר היחיד עליו הוא יכול להסתמך הוא *הזהות* בין הרמקולים.
אם יש למישהו כאן אפשרות, אני מציע ניסוי קטן: נגנו שיר מסוים בסטראו דרך שני הרמקולים הראשיים שלכם בלבד. כעת הקשיבו לו *רק* דרך רמקולי ה"סראונד".
בדיוק. הבנתם.
מבנה זה הוא הנצחה של גישת הסטראו+FX. 145771
כשאני מאזין למוזיקה, בדרך כלל אני פונה דווקא לעבר רמקולי הסראונד, ולא לעבר הרמקולים הקדמיים (מטעמי נוחות גיאוגרפית של החדר שלי). כמובן שאני גם דואג להגביר בהתאמה את הרמקולים האחוריים. אני לא מבחין בהבדל כלשהו בין זה לבין האזנה ''רגילה''.
אני בטוח שגם אתה יכול להבחין בהבדל אם 145787
תנסה, בדיוק כפי שתוכל, ללא מאמץ רב, להבחין בין שיר המושמע במונו לכזה המושמע בסטראו. אין לי מושג לגבי המערכת הספציפית או החדר הספציפי שלך, אבל הבדל קיים, בזאת אני בטוח.
אני בטוח שגם אתה יכול להבחין בהבדל אם 145861
הגדלתי ועשיתי, וחיברתי מחדש את הרמקולים שלי, כך שאלו ששימשו לסראונד היו מחוברים כרמקולים קדמיים ולהפך. לא הרגשתי הבדל באיכות המוזיקה. אני נאלץ להסיק מכך שכל חמשת הרמקולים שלי הם זהים (חוץ מאורך הכבל). מכיוון שמדובר במערכת מצ'וקמקת וזולה (יחסית, משהו כמו 1500 ש"ח לכל העסק), אינני מבין על מה הטענות.
הבעיה היחידה אצלי היא המיקום של הרמקולים, אבל זו כבר בעיה גיאוגרפית ולא טכנולוגית.
כמה זמן עבר בין השמעה להשמעה? 145883
אם יותר מכמה שניות - מה גורם לך לחשוב שאתה אכן מסוגל להשוות?
מצד שני, כאשר אתה שומע את המוסיקה בזמן אמיתי ואחד הכלים נודד מרמקול אחד למשנהו, או אז גם אתה תבחין בהבדל.
ופה נשאלת שאלה חשובה במיוחד 147038
למה אתה בכלל שומע מוזיקה דרך הרמקולים האחוריים, ומה בדיוק מושמע דרכם?

לרוב כששומעים מוזיקה, עדיף להגיד למגבר שיפסיק עם השטויות שלו. הרי ההבדל בין "אולם קונצרטים וינה א"' לבין "מועדון ג'ז ניו-אורלינס ג"' הוא בעיקר במידת העצבון שהם גורמים לך אם אתה לא יושב *בול* באמצע ואם לא כיוונת את ההשהיה בין הרמקולים הקדמיים לאחוריים בדיוק כמו שצריך.

לכן גם כשבונים מערכת קולנוע ביתי משקיעים יותר ברמקולים הקדמיים - כי את המוזיקה שאתה שומע אתה שומע מהם.
ופה נשאלת שאלה חשובה במיוחד 147574
מוזיקה אני שומע בלי אפקטים מיותרים. מה שבוקע מהרמקולים האחוריים, עד כמה שאני מסוגל להבחין, הוא בדיוק מה שבוקע מהקדמיים. הסיבה להיפוך, כאמור, היא נוחות גיאוגרפית‏1.
אגב, האם זה נכון שככצופים בסרט בסראונד המוזיקה בוקעת מהרמקולים האחוריים, או שזה הדמיון שלי?

1 כשאני צופה בסרט או משחק במחשב או אכפת לי לשבת על כיסא מול המסך. כשאני שומע מוזיקה, אני אוהב לקפץ, מה שמצריך שימוש בחלק ה(יחסית)פנוי של הרצפה שלי.
מילא 24bit, אבל 96KHz? 145762
מה דינמי במרחב של ה24 ביט? עושים המרת A/D שונה לכל שיר?
לא הבנתי את השאלה. 145792
אם שאלת "מה טוב ב-‏24BIT", התשובה היא: מרחב דינמי גדול יותר - רזולוציה גבוהה יותר של הייצוג הדיגיטלי של הצליל. גם במקרים בהם התוצאה הסופית היא 16BIT, חומר שהוקלט, מוקסס ומוסטר ב-‏24BIT ישמע טוב יותר.
תוספת חינם: מספר מונחים לשימוש כללי 145798
הקלטה: המרת צליל לייצוג אנלוגי (ע"ג סרט מגנטי) או דיגיטלי (ע"ג סרט, CD או מחשב). לצורך הדיון כאן מדובר בהקלטת הכלים השונים של יצירה מוסיקלית. כל כלי כזה זוכה ל*ערוץ* משלו.
מיקס: שילוב כל הערוצים לכלל יצירה שלמה. קביעת העוצמה (Volume) והצידוד (Panning) של כל ערוץ, כמו גם האפקטים דרכם הוא עובר (כדוגמת EQ, Reverb, Delay, Compressor, Chorus, Distortion וכו'). התוצר הסופי של תהליך המיקס הוא השיר/קטע כולו בסטראו (כלומר, שני ערוצים: Left ו-Right). המיקס העתידי בו דובר במאמר יכיל יותר מסטראו, כמובן. משהו כמו Left, Right, RearLeft, RearRight, Center ואולי גם MidLeft ו-MidRight. בכל מקרה, הפואנטה היא זו: התוצר של תהליך המיקס הוא במידה רבה השיר הסופי, ולא ניתן לשנות בו את העוצמות והכוונונים של הכלים.
מסטרינג: תהליך עיבוד המתבצע על גבי התוצר של המיקס על מנת לתת לו מעין "פיניש". בתהליך זה בדרך כלל מוגברת מאד העוצמה הכללית של השיר, מבוצע EQ מתקן כלשהו (תדרים מסוימים מונמכים או מוגברים לפי הצורך), ולעתים ננקטים צעדים נוספים. המסטרינג הוא התהליך האחרון בהחלט שעובר שיר בטרם השמעתו.

זהו. רק למקרה ש.
לא הבנתי את השאלה. 145839
לא לא, שאלתי מה *דינמי* בתחום. למה קראת לזה "מרחב דינמי של 24 ביט". בניגוד לסתם מרחב, או מרחב סטטי. האם אתה מחליט מה אומרת כל רמת ייצוג דיגטלית כל פעם מחדש?
הו, לא. הכוונה למרחב כפשוטו. 145879
אנו (הסאונדמנים, אמר והוציא סיגר) קוראים לו מרחב דינמי לא בגלל הדינמיות שלו אלא בגלל הדינמיות המוסיקלית שהוא מאפשר.
לא הבנתי את השאלה. 145892
אני לא בטוח שאתה צודק. קיצוץ לא מוצלח של חומר מ-‏24 סיביות לחומר של 16 סיביות יישמע גרוע יותר מאשר חומר שהוקלט היישר ל-‏16 סיביות.

קלייב קסלר (כתב ב-Stereophile) תהה כיצד ייתכן שקלטות שהועתקו מתקליטורים נשמעו טוב יותר בווקמן שלו מעאלו שהועתקו מתקליטי ויניל. ההסבר שלו: התקליט הכיל מידע מורכב יותר ש"העמיס" על הקלטת לעומת המידע הפשוט יותר שבא מהתקליטור.
רק כדי להבהיר: 145908
אני מוסיקאי ואיש סאונד, ואני עוסק בהקלטות באופן מקצועי. כשאני מדבר כאן על הנושא, אני מדבר מנסיון.
כעת: קיצוץ לא מוצלח אכן ישמע רע, ולכן דואגים לעשות קיצוץ *מוצלח*. תוצאותיו של הקיצוץ המוצלח נשמעות יותר טוב מחומר שעובד כולו ב-‏16BIT. זו לא דעה - זו *עובדה*.
באשר להשערתו של מר קסלר, הרי שאני מוצא אותה אידיוטית במקרה הטוב. קלטת, בדיוק כתקליט, היא אמצעי אחסון *אנלוגי*. הקלטות שהועתקו מתקליטורים ישמעו טוב יותר בגלל אחת מהסיבות הבאות:
א. תקליטים שחוקים
ב. פטיפון מאיכות נמוכה
ג. מגבר פטיפון מאיכות נמוכה
ד. אי התאמה בין הפטיפון/מגבר הפטיפון למגבר הסטראו או לטייפ
ה. עוצמה - בדרך כלל, בהעברה ל-CD, משתדלים להגביר את עוצמת הצליל ככל האפשר. אם מר קסלר השתמש באותו ווליום הקלטה לגבי תקליט ולגבי CD, הרי שההקלטות מה-CD ישמעו חזקות יותר ועל כן "טובות" יותר.

זהו. לא עומס ולא בטיח. יתכבד מר קסלר ויקנה לעצמו פטיפון משובח וגם, אם אפשר, מוח משומש במצב טוב.
רק כדי להבהיר: 145912
אני אמנם לא איש סאונד, אבל איש עיבוד אותות אני כן, ואם מה שאתה אומר זו עובדה, אז המדובר בסתם מגבלה הנובעת מהפרקטיקה ההנדסית, לא מהתאוריה שלה.

הרי גם את ה24 ביט קיבלת מאות אנלוגי, ואם במקום לעשות את הדרך אנלוגי-> 24 ביט -> 16 ביט, היית עובר ישירות מאנלוגי ל16 ביט, והיית עובד נכון, הדרך השנייה עדיפה או שווה לראשונה, בכל מובן יחיד שתבחר.

כשאני כותב בכל מובן יחיד, הכוונה היא אם הקריטריון ל"מה זה טוב" שלך קבוע (לדוגמא, MMSE - מינימום שגיאה ריבועית, הוא קריטריון מקובל בעיבוד אות. פחות מקובל בעיבוד תמונה, ולא יודע איך זה בעיבוד צליל).

אולי יש היום איזה מגבלת ציוד, אבל אין שום מניעה תאורטית או מעשית להצליח ישירות ב16 ביט כל מה שאתה מצליח ב24 ביט ומעביר ל16.
רק כדי להבהיר: 145914
במחשבה שנייה, אני חוזר בי. יש מניעה מעשית, ואכן עדיף לעבוד קודם ב24 ביט.

כשכתבתי את ההודעה שלי קודם, הנחתי שיש לך את האות האנלוגי מראש, ואז אתה מחליט איך לעשות את הקוונטייזר (ה A/D שלך). אבל בעצם בסאונד זה בעייתי, כי שאתה מקליט אתה לא יודע מראש את פילוג האות שלך, ולא יכול להחליט על קוונטיזציה אופטימלית. וכל מדיה של שמירה אנלוגית תוסיף בעצמה עוד רעש. כך שבאמת עדיף קודם לשמור הכל ב24 ביט, שבהשוואה ל16 ביט זה אות כמעט רציף, ואז להחליט איך לעבד.
נכון, ועוד דבר: 145926
האות לא סתם *מוקלט* - הוא גם צריך לעבור *עיבוד*. ופונקציות העיבוד עובדות טוב יותר ברזולוציה גבוהה יותר.
חשוב על כך באופן זה: נניח שקיימים שני ערוצים וצריך לבצע מיקס (ראה בעניין זה הודעתי מלמעלה). נניח שבמיקס אתה מעוניין להנמיך את אחד הערוצים. מה פירוש להנמיך, במדיום הדיגיטלי? נכון - להוריד את מספר הביטים, את הרזולוציה.
אופס!
נניח, לחילופין, שאתה מעוניין להגביר תדר כלשהו (לבצע EQ). כדי לעשות זאת אתה חייב Headroom, אחרת תקבל Clipping. וב-‏24BIT יש לך הרבה יותר Headroom.
נכון, ועוד דבר: 145946
כן, למרות שדווקא את כל פעולות עיבוד האות דווקא עדיף (מבחינת טיב) לעשות באנלוגי. קודם לעבד ואז לדגום. כמובן, שמחינה פרקטית עיבוד דיגיטלי הרבה יותר גמיש, ולא תלוי בפרמטרים של המעבד האנלוגי שבנית (גיל הרכיבים, אצוות הייצור וכד'), כך שבוחרים בו, אבל זה לא עניין של טיב.
נכון, ועוד דבר: 145948
שאלת תם:
יש איזה סיבה שעובדים בדיגיטיזציה FIXED POINT ולא FLOATING POINT ?

נקודה צפה תפתור את הבעיות של התחום הדינמי, לא?
נכון, ועוד דבר: 145951
וודאי שיש. הרי כשאתה בא לייצג משהו דיגיטלי, ובוא ניקח תמונת רמות אפור לשם הפשטות, הרי שראשית אתה אמור להחליט על טווח הייצוג - מה זה ''לבן'' ומה זה ''שחור''. אם הטווח שלך לא חסום, אז אין לך לבן (מקובל שלבן זה הערך העליון).
נכון, ועוד דבר: 145952
אם אני מבין נכון, לבן זה כמות האור המקסימלית שהמסך יכול להנפיק. באודיו זה כמו האמפליטודה המקסימלות של הרמקולים(?) . האם הבעיה היא לזהות מהו הערך הזה ולכייל את המדידות כך ש 24^2 זה הערך הזה? אני חשבתי שהבעיה היא שאפילו אם זה ידוע, רוב האקשן זה בערכים הרבה יותר נמוכים ( כמו למשל 12^2 ) ולכן מפסידים רזולוציה?

אם צריך כאן קורס שלם בחקר אותות אז אני מוותר, אבל אם יש הסבר יחסית קצר, אשמח לקבלו.
נכון, ועוד דבר: 145960
אני חושב שהבעייה היא שלי. הייתי צריך לברר למה אתה מתכוון בנקודה צפה מול לא. כשאני אומר "נקודה צפה" אני מתכוון שעם מספר ביטים (בדרך כלל 32) אפשר לייצג ערך לא חסום (כמעט) ע"ח הדיוק. למה זה אמור לעזור לך יותר מהערך הרגיל של הביטים הללו? מספר הקומבינציות של אחדים ואפסים נשאר קבוע.

בעייה של דגימה, בניסוח מתמטי, היא בעייה של העתקה מקטע ממשי, נאמר [0,1], למספר סופי של רמות, נאמר 256. בבעייה כזו, אתה צריך להחליט שני דברים - איפה מחליטים לעבור רמה, ומה מייצגת כל רמה כזו.

לדוגמא, עבור דגימת תמונת רמות אפור לביט בודד, בצורה נאיבית, היית יכול לבחור שכל הערכים עד חצי עוברים לאפס, וכל הערכים מחצי לאחד עוברים לאחד. בנוסף היית יכול לומר שאפס פרושו רמת אפור של 0 (שחור), ו1 פרושו הצגה של 1 (לבן), נגיד. אבל אז תקבל תמונה מאד חדה, ולא נעימה לעין, אז אולי עדיף להחליט ש0 פרושו 1/4 (אפור כהה) ו1 פרושו 3/4 (אפור בהיר)? אולי יש לך מעט מאד נקודות עם רמת אפור גבוהה מ1/2, ולכן עדיף להחליט שכל מה שגבוה מ0.4 הוא דווקא 1, כדי לקבל תמונה ברורה יותר? והמשחק הזה הוא המשחק שמשחק הדוגם שלך.

אם יש לך הרבה נקודות בערכים נמוכים, פשוט תקדיש להם הרבה רמות החלטה, ולא תהיה בעייה של רזולוציה.
אבל, כל זה נכון רק אם אתה יודע מראש איך מפולג האות (איפה האקשן), ולכן עדיף לך לשמור אותו קודם ב24 ביט, בלי לשחק משחקים, ולקוות שאתה לא מאבד הרבה, ואז למצוא את הייצוג הטוב ביותר.
נכון, ועוד דבר: 145980
אנחנו מסכימים בדבר ההגדרה של נקודה צפה- X ביטים מגדירים את המעריך והשאר, 32 - X, מתאר את המנטיסה.

היופי בנקודה צפה זה שהדיוק היחסי נשאר לכל אורך הסקלה-
בשיטת הנקודה הקבועה , אם עובדים ברזולוציה של 24 ביט ליד הקצה התחתון, ומודדים ערך של 5 , כל שגיאת עיגול תקפיץ את האות ב 20% ( 6 ל5 ).
לעומת זאת, בנקודה צפה, הדיוק היחסי הוא כגודל המנטיסה לכל אורך הסקלה.
נכון הדבר שבנקודה צפה אינך יכול להבדיל בין מיליון ומליון ואחד, אבל למי איכפת? לפחות אפשר להבחין בין אחד לשניים.

אני עדיין חושד שהסיבה היא יותר פרוזאית - החומרה לעיבוד אות עובד ב אינטיגר.
נכון, ועוד דבר: 145985
אז לא התנסחתי בבהירות מספקת.

נעבוד שנייה ב8 ביט. החלטנו כבר שFF זה לבן, ו00 שחור.אף אחד לא אמר שההבדל שתראה בין 00 ו01 זהה להבדל בין 01 ו02 - ייתכן ש01 מייצג שחור-פחות-קצת, אבל 02 מייצג שחור-פחות-שלוש-קצת. פשוט כי אין המון "אקשן" ליד השחור, אז החלטנו לוותר על רזולוציה. ייתכן שליד הלבן כבר יש לנו קפיצות של קצת חצי, או קצת רבע, פשוט כי שם היה הרבה מידע.

כך שאם יש לך 32 ביט, יש לך אפשרות לייצג 32^2 רמות, בלי קשר למשמעות שאתה מייחס להן - גם כך וגם כך אתה צריך לענות על השאלה מה כל קומבינציה אומרת.
עכשיו הבנתי. 145987
הבנתי שאתה אתה אומר שבפועל נקודה צפה(כמו שאני הגדרתי) זה מקרה פרטי של ההחלטת המיפוי.
נזכרתי שבאמת יש שני תקנים, אירופאי ואמריקאי, למיפוי אמפליטודה של דיבור ל 8 ביט באופן כמעט לוגריתמי( חוק מו וחוק A ?).
נכון, ועוד דבר: 146021
רגע, אם אני רוצה להכפיל חלק מהדגימות פי 2, אני צריך לקחת כל דגימה, לבדוק במפה מה זה אומר 1e3222 (נגיד שזה אומר 9), להכפיל פי 2 (קיבלנו 18) ואז לבדוק איזה ערך במיפוי שווה ל- 18 (אה, 200318). ואת זה אני עושה לכל דגימה בנפרד. לעומת זאת בנקודה צפה הכל נשאר ליניארי (מקסימום צריך להגדיל/להקטין את האקספוננט).

הניחוש שלי ללמה משתמשים בנקודה קבועה הוא פשוט כי לא צריך יותר מכך. שבבי DSP של נקודה צפה יקרים יותר ואיטיים יותר מאחיהם בני הנקודה הקבועה. אם אפילו לא התעורר עדיין הצורך ב- 32 ביט, כנראה שהעסק עובד מספיק טוב גם כך.
סיבה יותר בסיסית: 146056
הממירים (A2D,D2A) עובדים עם שלמים. קשה לייצג פורמט נקודה צפה באמצעות חומרה, בייטים מתרגמים ישירות לאות חשמלי ואילו מידע FP יומר קודם לערך שהממיר יוכל לעבוד איתו. FP יועיל בדיוק פנימי של המעבד, בהקטנת שגיאות מצטברות וכו'
נכון, ועוד דבר: 146082
החלק הראשון נכון (אבל למה שתרצה לעשות כזו פעולה מוזרה?), אבל מה פתאום שבנקודה צפה הכל ישאר לינארי? אתה עדיין צריך לתת פירוש לכל קומבינציה של ביטים, או שאתה נשאר עם מיפוי בקפיצה אחידה (שהוא לא כל כך רע, ומשתמשים בו במספר פורמטים. בעיקר אלה שתופסים מעט מקום).
נכון, ועוד דבר: 146223
למה שארצה? נניח שאני רוצה להגביר חלק מהאות? נשמעת לי פעולה די נפוצה.

בנקודה צפה אתה מקבל את כל היתרונות שבמיפוי לוגריתמי (ויותר!). המחיר הוא מרחב (עוד ביטים לייצוג האקספוננט בהנחה שהערך נשאר 24 ביט) וזמן (פעולות נקודה-צפה איטיות יותר). אמנם אתה לא מקבל בחינם כל מיפוי מוזר שתעלה על דעתך אך בהנחה שלרוב עובדים עם מיפוי סביר (כלומר חלק), אתה תהיה בסדר. אמנם אתה נשאר עם מיפוי בקפיצה אחידה, אבל הקפיצה היא הרבה יותר קטנה (ביחס של האקספוננט הקטן ביותר שאתה יכול לייצג).
אתה טועה בגישה 146732
כשרוצים להגביר חלקים מהאות רוצים להגביר חלק מה*תדרים* שלו, לא חלק מהתמונה. מה שאתה הצעת זו פשוט הבהרה של חלק מהתמונה, בלי להשיג כל שיפור בקונטרסט, פעולה שלא תעזור לאף אחד. אבל שוין, זה סתם באופן צדדי.

באשר לפסקה השנייה שלך, אתה פשוט משווה לא נכון. לא משווים בין הצגה של 24 ביט והצגה של 24 ביט + 8 ביט לאקספוננט, אלא בין זה לבין הצגה של 32 ביט, לעומתה אין שום שיפור.

ברור שאם תוסיף עוד מקום לייצוג תוכל להשיג שיפור, על כך אין שום ויכוח.
אתה טועה בגישה 146796
זה פשוט לא נכון. לפעמים אתה רוצה לבצע פעולות בזמן ולפעמים בתדר (אתה כל הזמן מדבר על תמונות, מה עושה מסנן הגברת קונטרסט בתוכנת הצפיה החביבה עליך?). גם פעולת תדר תעשה לעתים על ידי קונבולוציה בזמן הדורשת כפלים.

בקשר לפסקה השניה שלך, מותר לי להשוות בין מה שאני רוצה. שים לב שהמסקנה שלי היא שכרגע בשיקול מעשי 24 ביט בנקודה קבועה עדיפים על 24+8 בנקודה צפה בגלל זמן העיבוד ומחיר החומרה. בנוסף, ל- 32 ביט בנקודה קבועה יש חסרונות גם ביחס ל- 24+8 (מה קורה כשדגימה אחת היא 0x10000000.0 והשניה היא 0x0.00000001?).

על הפסקה האחרונה שלך באמת אין ויכוח.
אתה טועה בגישה 146803
כשאתה מגביר קונטרסט אתה עושה שיוויון היסטוגרמה - אוסף את כל הפיקסלים לגרף, ומותח אותו על כל הציר. זה דומה לקוונטיזציה מחדש. בנוסף, להזכירך, בתמונות אתה לא עושה פעולות בזמן, רק במרחב.

עכשיו, אתה באמת יכול להשוות בין מה שבא לך, השאלה היא אם אתה עונה על השאלה, ומה מקבלים מההשוואה שלך. מה שהקורא הנבוך שאל היה בקשר לטיב המתקבל, ובמובלע על שימוש בנקודה צפה וקבועה באותו מספר ביטים. מבחינת טיב, עדיף נקודה צפה של 32 ביט על קבועה של 24, למרות שאתה כמובן צודק בקשר לשיקולי המחיר והזמן.

מה שלא נכון הוא שיש לך חסרונות לנקודה קבועה מול צפה במפר ביטים שווה - אתה כל הזמן מניח קוונטיזציה במרווח קבוע שלא לצורך.

אם יש לך שתי נקודות כפי שהצגת, כנראה שאחת תצא שחורה, והשנייה לבנה, תלוי במפה שלך ובאלגוריתם הקווינטוט.
אז מה היה לנו? 147039
היה לנו איש סאונד, היה לנו מעבד אותות, ועכשיו הזמן גם למחשבים.

עיבודים ב-Floating Point לרוב גורמים לכאב לב לא קטן כשאתה מנסה לחבר מספרים גדולים למספרים קטנים. הם גם יגרמו לך לצער רב כשתנסה להשוות מספרים אחד לשני. לפעמים 3 פחות 3 זה לא 0, אלה 10 בחזקת מינוס 8. שזה אכן קרוב ל-‏0, אבל 0 זה לא.

או בקיצור - אם ידוע לך טווח הדיוק, תקשור את הנקודה לעמוד ואל תיתן לה לצוף סתם ככה. נקודות צפות יש רק באגד.
אז מה היה לנו? 147087
השאלה שהתכוונתי לשאול היתה : האם מקודדים אמפליטודות באופן לינארי או באופן לוגריתמי. אני מודה ששאלתי באופן עקום, אבל בהמשך הפתיל הנושא התבהר.

מכיוון שבתשובתך אתה מציין את הנוחות של חיבור מספר גדול וקטן, הרי שכנראה אתה בדעה שעדיף להשתמש בקידוד לינארי.

בזאת אתה עונה תשובה הפוכה ל תגובה 145985 שאומרת
(למיטב הבנתי) שמשתמשים ב"נקודה צפה" אבל במובלע.

על הדאגה שלא תוכל להבחין בין שני מספרים קרובים כבר עניתי שכל זמן שהשגיאה היחסית קטנה לא נראה לי שיש כאן ביג דיל.

כמו כן, זכרוני החלש כל הזמן לוחש לי G.711 . אמנם זה רק טלפוניה ולא מוסיקה, אבל לפחות מישהו(ITU) חושב שיש טעם בקידוד לוגריתמי.

אז מה היה לנו? 548604
תשובה מאוחרת לפתיל ארוך שהוצף מחדש ע"י האייל החדש:

הקישור שבור, אולם למיטב זכרוני אחד השיקולים לטובת השימוש בקידוד לוגריתמי ב<wiki G.711> הוא עמידות טובה יותר בפני רעש לעומת הקידוד הלינארי הפשוט (16 סיביות, לעומת 8 בקידוד הלוגריתמי). מקטינים את הגודל פי 2 וגם זה משהו.

אבל כשצריך לעשות איזשהו עיבוד לאות (לדוגמה: הגברה) ממירים אותו לקידוד לינארי, עושים מה שעושים, ומקודדים חזרה בקידוד לוגריתמי. שתי פעולות הקידוד הללו הן פשוטות למדי: חיפוש במערך של 256 בתים (מלוגריתמי ללינארי) או 65536 בתים (מלינארי ללוגריתמי).
מה שקורה בפועל הוא בדרך כלל פשרה. 145955
עיבוד מסוים מתבצע על האות לפני כניסתו למכשיר ההקלטה, ושאר העיבוד מתבצע לאחר מכן.
באולפנים גדולים ויקרים, כמובן, יש עדיין אפשרות להקליט באופן אנלוגי מלא ולדגום למחשב רק לאחר המיקס.
בכל אופן, קיימים סוגי עיבוד אותם לא ממש מעשי לבצע באופן אנלוגי. כל עיבוד הדורש Look-ahead או התייחסות לכל המידע על הערוץ (להבדיל מ-Realtime), למשל.
מילא 24bit, אבל 96KHz? 146439
המרת A\d?
אגב מהו dc computation בהקשר הנ"ל? (סתם מנצל את הדיון להרחיב אופקים)
מילא 24bit, אבל 96KHz? 146777
המרת A/D זה בסך הכל Analog to Digital, או בלשון העם - דגימה.

את המונח dc computation אני לא מכיר, אבל אשמח ללמוד עליו. באיזה הקשר בדיוק אתה מתכוון, ואיפה נתקלת בו?
מילא 24bit, אבל 96KHz? 146794
נתקלתי בו מתישהו לפני מספר חודשים כשהזדמן לידי חומר מודפס(!) שתיאר אלגוריתם שתכליתו לייצר "חתימה" מקטע אודיו. אני חושב שזה משהו שקשור לאופן שבו כל דגימה בפורמט מכווץ של מוזיקה מכילה מידע הרלוונטי גם דגימות הבאות והקודמות, אבל לא עמדתי על ההגיון‏1 לאשורו.

1 הנה הסבר איך זה עובד בתמונות (http://www.google.co.il/search?q=cache:wSy7W70GFSkC:...), אבל אני לא רואה איך אותה טכניקה יכולה להיות מיישמת על קול.
מילא 24bit, אבל 96KHz? 146799
ייתכן שאתה מדבר על קידוד דיפרנציאלי? מדובר בעקרון שיכול להיות מיושם בכל הקלטה או שידור של אות המשתנה בצורה יחסית רציפה ולא רק בתמונות וסאונד.

הנחות יסוד:
1. ככל שהאות קטן יותר, הוא תופס פחות מקום (זה נכון בגלל קידודי האנטרופיה שמשתמשים בהם).
2. כל דגימה יחסית קרובה לדגימה הקודמת (בתמונה זה אומר שאין הרבה מעברים חדים בין אזורים בהירים מאוד לכהים מאוד).

מסקנה:
במקום לשמור את הדגימה הנוכחית במלואה, נשמור רק את ההפרש מהדגימה הקודמת. מכיוון שמדובר באות קטן יותר (לפי הנחה 2), הוא תופס פחות מקום (לפי הנחה 1) ולכן הרווחנו. בשחזור פשוט נחבר את ההפרש השמור עם הדגימה הקודמת (שכבר שוחזרה).

בעיה:
נניח והדגימה הקודמת נדפקה, גם כל הדגימות שאחריה נדפקות מכיוון שהן מתבססות עליה.

פתרון:
מדי N דגימות שומרים דגימה באופן מלא ולא באופן דיפרנציאלי כך שהרצף הדפוק נעצר.
מילא 24bit, אבל 96KHz? 146800
טוב, איך מכווצים תמונה אני יודע, ואני גם יכול לראות איך זה תקף לקולות. יכול להיות שאני חוזר על מה שאתה כבר יודע, אבל נתחיל מהתחלה:

נניח שיש לנו תמונת רמות אפור עם 8 ביט - בייט אחד, לפיקסל (ההכללה לצבע קלה - פשוט 3 תמונות של רמות אדום, כחול וירוק). נניח שהיא בגודל של 64 על 64 פיקסל. כדי לשמור אותה ישירות (נגיד בBMP) צריך 64 בריבוע בייט. איך נכווץ? נשמור רק את השורה הראשונה ואת הטור הראשון בתמונה במלואם (64*2 בייט), ונמצא נוסחת שיערוך שאומרת לנו מה הערך בפיקסל הנוכחי כפונקציה של הפיקסל משמאלו, מעליו, ושני הפיקסלים באלכסונים העליונים. נתחיל לעבוד משמאל לימין ומלמעלה למטה, כשאנו משערכים כל פעם את הערך בפיקסל הנוכחי.
עכשיו, ברור שאין נוסחת קסם שתתן לנו את התמונה - אז נשמור עבור כל פיקסל את ה*שגיאה* מהנוסחה, וכך נקבל את הערך האמיתי באותו פיקסל. אם הנוסחה טובה (וניתן תמיד למצוא את המיטבית, זו בעייה פתורה) אז השגיאה תתפוס הרבה פחות מ8 ביט, יותר לכיוון ה5, ונחסוך המון מקום.

ככה, על רגל אחת, עובד כיווץ.

אותו דבר אפשר לעשות בקול - אם נשמור רק N ערכים תחיליים, ונוסחה שמחשבת את הערך הנוכחי על סמך N ערכים אחורה, ונשמור רק את השגיאה מהשערוך, נוכל לחסוך מקום רב.

מה זה DC computation? זה טריק כדי להוסיף עוד כיווץ על כיווץ. מסתבר (ממה שקישרת, ואם הבנתי נכון) שאם נפרק את התמונה למרכיב הDC שלה לבד, ולתדרים גבוהים בנפרד, אז את מרכיב הDC קל לשחזר ע"ס רק טור אחד עם מעט שגיאה, ואת הAC משחזרים בנוסחה נפרדת, בשיטת הזיג-זג כפי שהוצגה שם.

(לשאלה מה זה תדר גבוה ונמוך בתמונות, אני לא כל כך רוצה להכנס. אבל רק כדי לתת קצת אינטואיציה - מדברים על "תדר מרחבי", לא על תדר רגיל, ולמשטחים חלקים יש תדר נמוך, בעוד לשפות של אובייקטים, לדוגמא, יש תדר גבוה)

איך עושים אותו דבר לקול? אני רק משער כאן, אבל אני מניח שהכוונה היא לשמור את הDC (הממוצע של האות, במקרה זה) בנפרד, ולשחזר את האות-פחות-התוחלת, בשיטה שהצגתי קודם.
מילא 24bit, אבל 96KHz? 146801
אז כתוב שם: DC is the average value of the 8 x 8 original pixel values. באופן כללי יותר, זה שם לרמה של רכיב האפס בהתמרת פורייה.

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים