שלח תשובה

זירת השאלות

1506
צפיות
2
תשובות

שליפת טקסט מתוך אתר

,‏ 12 ביולי, 2015

אני רוצה לבנות בשרת אלגוריתם בשפת C# שפונה לאתר שאגדיר לו מראש
וייקח משם (כמובן באוטומציה מלאה) טקסט שנמצא ב-DIV מסוים.

אשמח לעזרה והכוונה
תודה!

2 תשובות

  1. אתה צריך לייבא את כל הדף באמצעות XMLHTTP ולקלוט את התגובה למשתנה סטרינג.
    ואז לפרסר אותו, כלומר באמצעות חיפוש על הסטרינג הארוך – למצוא את האלמנט שאתה מחפש. כנראה ש-REGEX יתאים במקרה הזה לצורך הפירסור.

  2. אחרי שאתה מייבא את כל הדף באמצעות ajax, יש לך כמה אופציות. או כמו שאלי כתב – להשתמש בREGEX. יש גם אופציה לפרסר עם JQUERY – $.parseHTML. אני בכל אופן חושב שהדרך הכי טובה היא ליצור אלמנט חדש (בלי להוסיף אותו באמת לדף), להכניס לתוכו את תוכן הדף השני ואז למצוא את האלמנט. לדוג':

    var el = document.createElement( 'html' );
    el.innerHTML = xmlhttp.responseText;

    txt = el.getElementsByTagName("h1")[0].innerHTML;

    כך במשתנה txt יש את תוכן הכותרת.

שלח תשובה