1506
צפיות
צפיות
2
תשובות
תשובות
שליפת טקסט מתוך אתר
אני רוצה לבנות בשרת אלגוריתם בשפת C# שפונה לאתר שאגדיר לו מראש
וייקח משם (כמובן באוטומציה מלאה) טקסט שנמצא ב-DIV מסוים.
אשמח לעזרה והכוונה
תודה!
אני רוצה לבנות בשרת אלגוריתם בשפת C# שפונה לאתר שאגדיר לו מראש
וייקח משם (כמובן באוטומציה מלאה) טקסט שנמצא ב-DIV מסוים.
אשמח לעזרה והכוונה
תודה!
2 תשובות
אתה צריך לייבא את כל הדף באמצעות XMLHTTP ולקלוט את התגובה למשתנה סטרינג.
ואז לפרסר אותו, כלומר באמצעות חיפוש על הסטרינג הארוך – למצוא את האלמנט שאתה מחפש. כנראה ש-REGEX יתאים במקרה הזה לצורך הפירסור.
אחרי שאתה מייבא את כל הדף באמצעות ajax, יש לך כמה אופציות. או כמו שאלי כתב – להשתמש בREGEX. יש גם אופציה לפרסר עם JQUERY – $.parseHTML. אני בכל אופן חושב שהדרך הכי טובה היא ליצור אלמנט חדש (בלי להוסיף אותו באמת לדף), להכניס לתוכו את תוכן הדף השני ואז למצוא את האלמנט. לדוג':
var el = document.createElement( 'html' );
el.innerHTML = xmlhttp.responseText;
txt = el.getElementsByTagName("h1")[0].innerHTML;
כך במשתנה txt יש את תוכן הכותרת.