בתשובה לטל כהן, 15/11/04 9:37
מנוע החיפוש 261268
א. ברכות (ותודה) למיץ פטל שעשה זאת שוב בפעם המי יודע כמה.
ב. לדעתי המאד פרטית הטרייד-אוף בכללותו היה משתלם למדי לולא המיגבלה שלא ניתן לפלטר גם סיומות של מילים (כמו בדוגמא שנתתי קודם). בשפה שבה ההטיות מורכבות על המילה עצמה, זוהי מגרעת ענקית. אם לא די בכך שחיפוש ''אייל'' לא ימצא את ''איילים'', צריך עכשיו גם לחפש ''איילים'' בנפרד מ''איילות'', וזה עוד טוב ביחס להטיות פעלים.
ועוד משהו 261271
שיחקתי קצת עם המנוע כדי לראות מה קורה. האם פילטור התחיליות נעשה מתוך רשימה קבועה מראש (למשל: חיפוש "שבים" ימצא את "השבים" אבל לא את "מחשבים")?
ועוד משהו 261335
כדי למזער תוצאות שווא, הסינון נעשה לפי regular expression שיצרנו אשר אמור לזהות שילובים חוקיים של תחיליות מש"ה וכל"ב.
אציין שזה כולל שילובים שערוריתיים אך תקינים כגון "ושלכשמה-" ("ידוע שהיום יום שני, ושלכשמהיאור תעלנה שבע פרות שמנות נעשה מנגל").
ועוד משהו 261397
האם לא ניתן באופן סימטרי לטפל ‏1 גם בסיומות?
ובשילובים של תחיליות וסיומות כמו ב"האיילות"?

1 אולי אפילו באמצעות אותו מנגנון
ועוד משהו 261505
חסרי סבלנות, האיילים האלה.

בתגובה 261262 כתבתי: "שיפורים נוספים יוצגו בהמשך". בפרט, יש פתרון לבעיית הסיומות (לא מבוסס על סימטריה, אגב). הוא אינו מיושם כרגע בעיקר משיקולי "בואו ונראה איך המנוע החדש עומד בעומס לפני שנעביר הילוך".

חזרה לעמוד הראשי המאמר המלא

מערכת האייל הקורא אינה אחראית לתוכן תגובות שנכתבו בידי קוראים