kristallpirat
@kristallpirat.bsky.social
📤 45
📥 63
📝 319
Raumstationsavatar Nischenprodukt
#SchrifttumsLinguistik
Datenförster Regelschleifer
Dieser Satz ist schwer zu parsen. Nun hab ich eine Lösung, die auch hält, wenn es subtile Unterschiede gibt ("," statt "-" & verschiedene Sorten "). Koref zickt noch etwas. Was mir aber auch wieder bewußt wird: ich brauche Normalisierung von Quellen.
#SchrifttumsLinguistik
12 days ago
0
0
0
Da kann ich noch eine Visualisierung nachreichen:
#SchrifttumsLinguistik
add a skeleton here at some point
20 days ago
1
0
0
Und da sollte natürlich
#SchrifttumsLinguistik
dran stehen.
add a skeleton here at some point
about 1 month ago
0
0
0
Ich habe endlich angefangen Koreferenz zu implementieren. Das letzte größere Problem vor der Abbildung der Rechtssprache in ein Graph Neural Network (GNN).
about 1 month ago
0
2
1
reposted by
kristallpirat
Carolin Kemper
about 2 months ago
Today has been a vibe-coding intense day: First, my The Lawfare Institute article on vibe coding was released, read here:
www.lawfaremedia.org/article/when-the-vibe-are-off--the-security-risks-of-ai-generated-code
Second, I gave a quick talk on vibe coding at the Gikii conference in Amsterdam.
1
5
1
Ich weiß, ich bin pedantisch, aber vom BVerfG sollte ich bessere Rechtschreibung erwarten können, find ich. Konsistentes Klammern sieht anders aus. Ich sehe, ja ein, dass nicht (bb)) geschrieben wird, aber nach aa) fehlt klar ein ).
#SchrifttumsLinguistik
2 months ago
2
2
0
Auf Zeitungstext trainierte ML-Modelle haben immer wieder Probleme mit juristischen Texten. Außerdem fehlt mir bei Universal Dependencies eine einfache Phrasenbildung (li). In meinem regelbasierte Modell sind Phrasen von Anfang mitgedacht und vereinfachen einiges (re).
#SchrifttumsLinguistik
3 months ago
0
1
0
"v. Münch/Kunig, Grundgesetz-Kommentar, 4./5. Aufl. 2003" Na was denn nun? 4. oder 5. Auflage? Also selbst wenn in dem Jahr verschiedene Bände in unterschiedlicher Aufl. erschienen sind, so sollte doch klar sein aus welchem Band zitiert wurde? Bundesgerichte ...
#SchrifttumsLinguistik
3 months ago
1
0
0
Warum ist da ein Komma nach der 355 ("BFHE 203, 355,")? Klar ich kann d als zur Quelle gehörig markieren, damit d VP weiterläuft und das "ein" zum "fügt" erkannt wird, aber wenn da wirklich mal ein K. sein soll, dann würde d verschluckt. D macht es der Analyse nur schwerer.
#SchrifttumsLinguistik
4 months ago
0
0
0
Einer der großen Vorteile von einem Tokenizer der Multiworttokens erlaubt: Man kann "nicht nur" einfach als einen KONN Token täggen. Und schwupps erkennt die Software auch die Adjektivprädikation (mit Kopulaverb). (Die anderen Probleme des Satzes ignorieren wir mal noch).
#SchrifttumsLinguistik
4 months ago
0
3
0
Sagte ich "ein" breitenloser Bindehemmer (dt. für ZWNJ)? Ich finde insgesamt 22 (allein in den Gründen der Entscheidungen). Irgendwo in einer weiteren Entscheidung versteckt sich auch mindestens ein '\u200b' (ein breitenloses Leerzeichen).
#SchrifttumsLinguistik
add a skeleton here at some point
4 months ago
0
0
0
#SchrifttumsLinguistik
Der Fehler ist richtig fies im Absatz 297 von rs20190730_2bvr168514.html versteckt sich ein "zero-width non-joiner (ZWNJ)" (
unicode-explorer.com/c/200C
) Man kann ihn aber selbst im Source der Seite nicht wirklich sehen (vor dem 'M' von Müller).
5 months ago
1
0
1
#SchrifttumsLinguistik
Die kleinen Fehler sind oft die ärgerlichsten: Sannwald, in: Schmidt/Bleibtreu/Hofmann/Hopfauf, GG, 11. Aufl. 2008, in fs20101012_2bvf000107.html Rn. 128 liebes BverfG sollte Schmidt-Bleibtreu/Hofmann/Hopfauf sein.
5 months ago
1
0
0
Verben sind Funktionen, hier also die neusten Zahlen dazu welche Funktionen am häufigsten im BVerfG-Korpus vorkommen. Natürlich führen Hilfs- und Modalverben die Liste an (Modalverben sind Funktionen auf Funktionen).
#SchrifttumsLinguistik
5 months ago
0
0
0
If you could see any movie for the first time again, which movie would you pick? (I'd pick the english version).
add a skeleton here at some point
5 months ago
0
1
0
Ich habe mal wieder einen Tag an Versionsnummer verloren. So sehr ich Fortschritt schätze, er nervt.
6 months ago
0
0
0
reposted by
kristallpirat
Ars Technica
6 months ago
loading . . .
Open source project curl is sick of users submitting “AI slop” vulnerabilities
“One way you can tell is it’s always such a nice report,” founder tells Ars.
https://arstechnica.com/gadgets/2025/05/open-source-project-curl-is-sick-of-users-submitting-ai-slop-vulnerabilities/?utm_source=bsky&utm_medium=social
3
75
23
Das Erstellen einer Webseite zur
#SchrifttumsLinguistik
ist aufwändig und zieht sich. Hier mal wieder ein Teaser. Vor der Webseite oder relativ zeitgleich werde ich auch das Tool für die Graphiken als open Source bereitstellen.
7 months ago
1
4
0
reposted by
kristallpirat
Ines Montani 〰️
7 months ago
I don't normally write advice columns but this question I got deserved its own post: With all the hype around Generative AI, how can you, as a developer, communicate the nuances and advocate for new and modular solutions that are better, easier and cheaper?
explosion.ai/blog/modular...
3
26
8
reposted by
kristallpirat
#SchrifttumsLinguistik
Heute der Satz: Eine Verletzung von Art. 14 I GG ist nicht feststellbar. 2 Modelle, verschiedene Darstellungen. Wer als Jurist spaCy nutzt, sollte das Transformermodell nutzten wenn möglich.
9 months ago
0
0
1
#SchrifttumsLinguistik
Heute der Satz: Eine Verletzung von Art. 14 I GG ist nicht feststellbar. 2 Modelle, verschiedene Darstellungen. Wer als Jurist spaCy nutzt, sollte das Transformermodell nutzten wenn möglich.
9 months ago
0
0
1
#SchrifttumsLinguistik
Sprachmodelle sind ein wenig wie Juristen, fragt man verschiedene, bekommt grundsätzlich ähnliche, aber im Detail von einander abweichende Antworten. 1 und 2 ML-Modelle, 3 regelbasiertes Modell.
10 months ago
0
2
0
#SchrifttumsLinguistik
Ein Satz aus BGH, Urteil vom 26.06.2003 - I ZR 176/01 mal etwas anders dargestellt. 🙃 Schön das der Transformer erkennt, dass "müssen" sich auf "treten" bezieht.
10 months ago
0
0
0
#SchrifttumsLinguistik
#workInProgress
Das Tool für die Visualisierungen kommt voran. Ist aber (noch) nicht meine Toolchain, sondern @spacy_io (von
bsky.app/profile/expl...
) + brat. Also openSource (wird das Tool auch).
10 months ago
0
0
0
#SchrifttumsLinguistik
KI Werkzeuge sind schon auch zu was nutze. Bisher die visuelle Darbietung bestimmter Zusammenhänge eher mau. Unter Anwendung eines KI Werkzeuges wurde diese Demo gebaut. Die wird natürlich noch verbessert, aber man sieht wohin die Reise geht.
loading . . .
demo
https://kristall.crew.c-base.org/openJur/demo.html
11 months ago
0
0
0
"Eine hieraus resultierende mögliche Gefährdung für das Wohl der dort behandelten Patienten ist nicht erkennbar." hat es in die Subtests geschafft. Ist auch ein 'schöner' Test, denn das "für" kann grundsätzlich sowohl an die "Gefährdung" als auch ans "erkennbar" binden.
#SchrifttumsLinguistik
11 months ago
1
0
0
Nochmal zur Mittagszeit, statt mitten in der Nacht. Insbesondere was für die Juristen unter meinen Followern.
add a skeleton here at some point
about 1 year ago
0
1
0
#SchrifttumsLinguistik
Einige Anmerkungen zu Paragraphenketten und Volltextsuche (bspw Elasticsearch): - Paragraphenketten (PPKn) müssen Normalisiert werden (Abs. 1 vs I) 1/n
about 1 year ago
1
0
1
chatGPT und der zwingende logische Schluss: Wenn eine Versuchsstrafbarkeit explizit im StGB angeordnet wird, muss es sich um ein Vergehen handeln (mehrfach im Kontext durchgekaut). Kriegt die Maschine aber nicht fehlerfrei hin. Fazit: Unnützes Spielzeug!
about 1 year ago
0
1
0
reposted by
kristallpirat
Jessie
over 1 year ago
#JedeWocheEinFoto
KW 12/24 Allein allein...
0
64
10
#SchrifttumsLinguistik
Komplexe Aufzählungen (am Beispiel von § 119 III UrhG) (Am Rechner und nicht auf dem Smarty lesen):
kristall.crew.c-base.org/Komplexe_Auf...
over 1 year ago
0
1
2
Straße zur Sonne
almost 2 years ago
1
1
0
#SchrifttumsLinguistik
Wer will was von wem woraus? Wer hat wo wann was getan, wie womit weswegen? Besteht Aussicht auf Erfolg? Recht startet mit einer Frage. Die Grammatik der
#SchrifttumsLinguistik
nutzt daher Fragen als Startvariablen.
almost 2 years ago
1
0
0
#SchrifttumsLinguistik
Ich sollte diese Mindmap mal dringend weiterbearbeiten, wie ich grad feststelle.
almost 2 years ago
0
0
1
#SchrifttumsLinguistik
Das @BVerfG legt noch einen drauf: "Gerold/Schmidt/von Ecken/Madert/Müller-Raabe" Richtig wäre "von Eicken" und "Müller-Rabe". Ich übernehm gern Eure QA, wenn ihr Hilfe braucht ...
add a skeleton here at some point
almost 2 years ago
0
0
0
#SchrifttumsLinguistik
Wenn man zum ersten mal "RTDrucks" in den Quellen liest (ohne das Datum dazu), dann fragt sich schon erstmal was das sein soll. Mit dem Datum (26. März 1920) wird es schon klarer, das eine ReichstagsDrucksache gemeint ist. Nun weiß es auch die Software.
almost 2 years ago
0
0
0
#SchrifttumsLinguistik
Die Quellenarbeitsqualität läßt leider auch beim @BVerfG Wünsche offen: (vgl. EGMR <GK>, Ogur v. Türkei, Urteil vom 20. Mai 1999, Nr. 21594/93, NJW 2001, S. 1991 <1994>) Wer dieser Nr. folgt wird fündig. So weit, so gut, aber,
almost 2 years ago
1
0
0
#SchrifttumsLinguistik
Das große i und das kleine L sehen sich in anscheinend in zu vielen Fonts zu ähnlich, warum sonst würde das @BVerfG es schaffen "(BGBI I S. 313)" statt "(BGBl I S.313)" zu schreiben ... (und mal mit "." und mal ohne ...)
almost 2 years ago
0
0
0
Es heißt nicht Silvester, sondern Zwangsgeburtstag. Guten Rutsch.
almost 2 years ago
0
0
0
#SchrifttumsLinguistik
AK ist ein am BGH verwendetes Registerzeichen. Die Software hielt die in einem Urteil vorkommende AK 47 deshalb für ein Aktenzeichen. Es gibt nun eine eigene Kategorie für Waffen.
almost 2 years ago
0
1
0
#SchrifttumsLinguistik
Stell Dir vor das BVerfG zitiert aus einem Buch von Dir und schreibt dann Deinen Namen falsch: "Kullack, in: Heiermann/Riedl/Rusam," (Rn. 25 2x & korrekt) vs. "Kullack, in: Heiermann/Riedel/Rusam," (Rn. 27 falsch)
bundesverfassungsgericht.de/SharedDocs/E...
almost 2 years ago
0
0
1
'Daneben soll unter dem Titel "Generatives Sprachmodell der Justiz" eine Art eigenes <LLM> für die Gerichte entwickelt werde.' Ich hätte nachweislich dazu einiges beizutragen. Allerdings weder die Lobby noch das Kapital.
#SchrifttumsLinguistik
www.lto.de/recht/justiz...
about 2 years ago
0
0
0
Aloha, auch im blauen Himmel werde ich viel über #SchrifttumsLinguistik erzählen. #SchrifttumsLinguistik ist die Anwendung von computer- und korpuslinguistischen Methoden auf das (juristische) Schrifttum. Zur Anwendung kommen nur Lexikon und Code und (noch) keinerlei maschinelles Lernen.
about 2 years ago
0
2
0
you reached the end!!
feeds!
log in