A potrzebuję czegoś działającego dokładnie na odwrót, tzn. usuwający z długiego tekstu wszystko inne oprócz fragmentu pasującego do wzorca. Proszę o podpowiedź, jak to zrobić.
Hej
Ja mam taki skrypt, który operuje na pliku tekstowym (stworzonym przez tesseract-ocr z wycinka strony). W tym pliku szukam sobie ciągu, który zaczyna się od cyfry 3 i jest po nim 6 znaków. To polecenie:
sed -n 's/.*\(3[A-Z0-9]\{6\}\).*/\1/p' plik_z_tekstem
wyciąga mi taki właśnie fragment jak potrzeba. Ja sobie go później zapisuję do osobnego pliku. Wystarczy, że sobie dopasujesz wzorzec i powinno być ok.
Tak samo, tylko trochę inaczej Jeżeli ciąg jest w jednej linii tego tekstu i między tym, co podałeś jako początek, a tym, co podałeś jako koniec ciągu nie występuje ani jeden znak mniejszości < to taki kod załatwia sprawę: