• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Bash: Problem: Abschnitt aus einem Text herausfiltern

SebCon

Newbie
Hallo,
mein Problem, weil ich nicht genau weiß wie ich das mit grep und sed lösen kann:

Ich muss aus einer HTML Seite einen bestimmten Abschnitt herausfiltern. Es wird ein Keyword (hier ein Datum) vorgegeben und
es muss der darunter folgende Abschnitt bis zum nächsten Keyword herausgefiltert werden.

Hier mal Code um das zu verdeutlichen:


<html>
<head> </head>
<body>


<table>
<tr>
<td>
28.09.2007
</td>
</tr>
</table>

<p class="aatext">
<a href="irgendwas"> Text 1 </a>
</p>

<p class="aatext">
<a href="irgendwas"> Text 2 </a>
</p>

<p class="aatext">
<a href="irgendwas"> Text 3 </a>
</p>



<table>
<tr>
<td>
29.09.2007
</td>
</tr>
</table>

<p class="aatext">
<a href="irgendwas"> Text 4 </a>
</p>

<p class="aatext">
<a href="irgendwas"> Text 5 </a>
</p>

<p class="aatext">
<a href="irgendwas"> Text 6 </a>
</p>



</body>
</html>



Wenn der 28.09.2007 vorgegeben wird, dann muss Text 1, Text 2 und Text 3 ausgegeben werden.
Wie stelle ich das jetzt an? Bin für jede Hilfe dankbar.
Hinweis: Im GNU Grep gibt es das Flag -P nicht, was die Sache vereinfachen würde.

Mit freundlichen Grüßen
 

}-Tux-{

Hacker
SebCon schrieb:
mein Problem, weil ich nicht genau weiß wie ich das mit grep und sed lösen kann:
Wiso willst du das unbedingt mit grep und sed loesen? In solchen Faellen
wuerde ich schnell zu einem perl Script greifen :)


}-Tux-{
 
Oben