Nabend!
Ich sitz grad dran mir ne kleine Mensaapp für unsere Mensa zu basteln. Da ich eigentlich dafür nur ein paar Tabellen auslesen muss dachte ich mir verzichte ich auf nen kompletten HTML Parser und durchforste einfach die HTML-Seite per regular expressions.
Jetzt bin ich aber seit ner Stunde am <td> Tag und es funktioniert einfach nicht.
Egal wie blöd ich den regex-string auch baue sowie ich auch nur an td denke wird alles gelöscht.
Hier mal die Funktion:
public void filterHTML() {
Iterator it = readHTML.iterator();
while(it.hasNext()) {
String s = (String) it.next();
if(!s.matches(".*?td.*"))
it.remove();
}
twTest.setText(""+readHTML.size() + " "+ readHTML.toString());
}
wenn ich statt td th, tr, table, title oder jeden anderen beliebigen Tag eingebe funktioniert es problemlos, nur bei td ist das Ergebnis leer. Was übersehe ich?
Auch komplexere Kombinationen bringen nichts.









Automatisch generierter Sicherheitshinweis
html dort in das große feld eingeben und ob en den regex. funktioniert schön mit ( ) gruppen etc.
![[Hilfe] HTML und Regex](http://www.proboard.ch/images/ppc10/Zum-Antworten-bitte-registrieren.jpg)
