בתשובה לאלון עמית, 08/08/08 18:56
עזרה 487181
לא. נניח שאני מקליט אותך מדקלם את התגובה הנ"ל ולוקח לך כ 30 שניות לקרוא אותה. אני רוצה לראות אם יש הבדל בין שלושה קטעים בני 10 שניות כ"א. ז"א, נניח שלקראת הסוף אתה מתעייף ומדבר בקול חלש יותר אבל מהר יותר, או אולי עושה הפסקות גדולות יותר בין המילים או המשפטים. מה שהערכים המספריים משקפים, חווית השמיעה, או תוכן הדברים אותם דקלמת לא רלוונטיים. רק אם יש שינויים בהפקת הקול.
עזרה 487184
"חווית השמיעה" היא איך הדברים נשמעים לאוזן האנושית, להבדיל מהמספרים הדגומים עצמם. זה כולל עוצמה ("קול חלש יותר", "הפסקות ארוכות"), תדירות (גובה הקול), וגם דברים מורכבים יותר (והרבה יותר קשים לניתוח) כמו מהירות הדיבור. את אף אחד מהדברים האלה לא תוכל לראות ע"י התבוננות גרידא במספרים הדגומים, לא חשוב באיזה קצב.

מה שתצטרך לעשות הוא דגימה בקצב גבוה ואיזשהו סוג של אנליזה במישור התדר, חיפוש "פסגות" ופורמנטים, והשוואתם בין הקטעים. הפרטים של האנליזה הזו יהיו שונים מאוד בהתאם לאופי ההקלטה (דיבור, שירה, כלי נגינה בודד, תזמורת).

השוואה בין "סדרות של דציבל" (הערכים הדגומים) בקצב של 10 או 100 דגימות בשנייה לא תניב מידע מעניין כלשהו על הפקת הקול, וגם עם דגימות בקצב גבוה לא תוכל לגלות הרבה עם SPSS. דרושים כלים ייעודיים של עיבוד אותות שמע, לא אנליזה סטטיסטית.

אם אתה אכן מתעניין בדיבור (וזו לא היתה סתם דוגמה), ראה למשל כאן:

עזרה 487186
אתה מוכן להרחיב קצת על הפיסקה שמדברת על "סדרות של דציבל" ולמה היא לא תתן מידע מעניין? שוב, אני רוצה לדעת אם בקטע מסוים של ההקלטה יש שינוי בדפוס הדיבור, במיוחד בהשוואה לקטע שקודם לו. יכול להיות שבאמת עוצמה בלבד לא מספיקה וצריך לבדוק גם נניח תדידות.

הקובץ שאני מדבר הוא אכן של דיבור למיקרופון והלינק נראה מעניין, לפחות מהרפרוף החפוז. אמנם הם כותבים על בעיות שבטכניקה הראשונה, אבל אולי אנסה אותה בשביל התרגיל, למרות העבודה ידנית עם כל הבעיתיות שלה.
עזרה 487188
100 דגימות בשנייה של אות שהתדר האופייני הבסיסי שלו (וזה בלי הפורמנטים) הוא בין 100 ל-‏300 מחזורים בשנייה הן סדרה אקראית למדי של מספרים.

[אינטואיטיבית, נסה לחשוב על גל פשוט ביותר (סינוס נקי, נניח 100 מחזורים בשנייה) ושים עליו נקודות המרווחות בערך מחזור בודד. מה מתקבל? מה קורה אם נזיז קצת את תדר הדגימה? אם נזיז קצת את הנקודה בה התחלנו לדגום?]

"שינוי בדפוס הדיבור" הוא מושג רחב מאוד. אם אתה רוצה רק להבחין בין "קול רם" ל-"קול חלש", ייתכן שתוכל לראות זאת ע"י מיצוע של דגימות בקצב נמוך. עדיין, כל תוכנת עיבוד אותות פשוטה תאפשר לך לעשות זאת הרבה יותר בקלות מאשר לטפל בקובצי CSV ע"י SPSS.

כל דבר אחר - שינויים בטון הדיבור, צרידות, עייפות, מספר מילים בדקה, מה שלא יהיה - מחייב דגימה בקצב גבוה, ניתוח תדרים והרבה עבודה נוספת. נסה להקליט את עצמך אומר "האייל הקורא" עשר פעמים רצוף תוך שמירה על גובה, טון, קצב, עוצמה וכו' אחידים ככל הניתן, ואח"כ תסתכל על דיאגרמות תדר מהסוג שיש בקישור הקודם ששלחתי. אני חושב שתמצא המון הבדלים במבנה העדין ובערכים המספריים (גם של הדגימות וגם של התדרים) מהסוג שיבלבל לחלוטין כלי סטנדרטי של ניתוחים סטטיסטיים.
עזרה 487211
תודה על ההסבר.

כן, אני רוצה להבחין בעיקר בין קול רם/חלש, שקט פתאומי או הרמת קול רגעית, נניח בגלל הבעת כאב או צחוק פתאומי (ולא אכפת לי מה גרם לשינוי הרגעי כל עוד אפשר לכמת את קיומו). איזו תוכנת עיבוד אותות יכולה לעשות את זה כך שאפשר יהיה לראות שקטע מסוים אכן שונה במובהק מהקטע שקדם לו בגלל שהוא כולל שינויים כמו הנ"ל?
עזרה 487256
אני מאוד לא מעודכן, וגם כשהייתי קצת יותר מעודכן לא הייתי מומחה. חפש משהו שאפשר להשיג בחינם כמו SFS מהקישור שהבאתי למעלה. סביר שתצטרך לעמול יותר עם תוכנה כזו מאשר עם משהו מהוקצע יותר. יש הרבה פרטים שאני לא מבין עדיין לגבי המטרות שלך - רמת הדיוק והרגישות, המגוון של השינויים שאתה רוצה לזהות - ויש להם השפעה רבה על הגודל של פרוייקט כזה. אם אתה רוצה להקדיש לזה יותר מכמה שעות הייתי ממליץ בחום לחפש מישהו שיודע משהו על speech analysis באוניברסיטה הקרובה למקום מגוריך, או בחברת התוכנה לעיבוד דיבור בה עובדת ידידתך.
עזרה 487301
אם זה בסדר מצדך אשלח לך פרטים באימייל.
עזרה 487364
אתה לא צריך לבקש רשות. שים לב לכתובת הדוא''ל בהודעה הזו.
עזרה 488879
האם קיבלת את האימייל ששלחתי לפני כמה זמן?

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים