batterie

Etymologie,Linguistik — 2. Oct 2011

vor gut einer woche war ich in der stadt basel, genauer gesagt auf der batterieanlage. bei dieser gelegenheit haben meine begleiter und ich uns gefragt, was es mit dem namen batterie auf sich hat, und ob es sich um dasselbe wort handelt wie bei batterie im sinn von ‘mobiler energiespeicher’.

nun zeigt sich, dass das wort batterie im deutschen seit dem 17. jahrhundert existiert und zunächst einen militärischen verwendungszweck hat. es bezeichnet eine aus mehreren einheiten bestehende artillerieeinheit. offenbar war die präzision der kanonen damals noch so schlecht, dass man jeweils mehrere kanoneneinheiten zu einer gruppe zusammenfasste und auf das selbe ziel schiessen liess, um die chance zu erhöhen, einen treffer zu landen. in dieser bedeutung ist das wort aus dem französischen bezogen, vgl. franz. batterie, eigentlich wörtlich ‘das schlagen’ (vom verb battre ‘schlagen’). auch der militärische ausdruck bataillon ‘militärischer verband’ geht auf diese grundlage zurück.

später wurde das wort auch auf den ort übertragen, wo sich die batterie befindet – also den artilleriestützpunkt. in diesem sinn ist also die batterieanlage in basel zu verstehen.

bei der batterie im sinn von ‘mobiler energiespeicher’ handelt es sich offenbar etymologisch gesehen tatsächlich um das selbe wort. im deutschen kommt es in dieser bedeutung erst seit dem 18. jh. vor und wurde über engl. battery vermittelt. wie es zu dieser bedeutungsübertragung kam scheint nicht restlos geklärt, aber die etymologen meinen, es dürfte etwas damit zu tun gehabt haben, dass bei einer batterie (‘artillerieeinheit’) – wie gesagt – mehrere kanonen zu einer einheit kombiniert wurden, um einen bestimmten wirkungsgrad zu erreichen. historische batterien (im sinn von ‘energiespeicher’) sind nämlich ebenfalls aus mehreren elementen aufgebaut, da sie erst durch die reihenschaltung mehrerer galvanischer zellen die gewünschte wirkung entfalten.

referenzen
kluge, f. & seebold, e. (2002): etymologisches wörterbuch der deutschen sprache. berlin. 24. auflage.
pfeifer, w. (1997): etymologisches wörterbuch des deutschen. münchen. 3. auflage.
wyld, h. c. (1961): the universal dictionary of the english language. london.

auflagen und nachdrucke

Linguistik,Uni,VGS — 28. Sep 2011

bei büchern, die in mehreren auflagen erschienen sind, ist gemäss den üblichen akademischen richtlinien stets die neueste auflage zu zitieren. etwas unklarer ist die situation bei nachdrucken. hier habe ich schon alles gesehen: es wird das jahr der ursprünglichen publikation zitiert, es wird das jahr des nachdrucks zitiert, oder es werden beide jahreszahlen angegeben.

meistens wird empfohlen, von diesen das jahr der ursprünglichen publikation vorzuziehen, da der leser daraus sofort schliessen kann, auf welchem forschungsstand sich das werk befindet. zudem ist es etwas irritierend, einen literaturverweis wie “braune 2011” zu sehen, wenn man weiss dass w. braune bereits 1926 verstorben ist, und es sich bei “2011” nur um das jahr des nachdruckes handelt. das jahr des nachdrucks interessiert meistens auch nicht wirklich – in der regel gibt es keinen grund, warum jemand speziell am nachdruck interessiert sein sollte, und das aufstöbern des titels gelingt bei nachdrucken in der regel auch dann, wenn man nur die angaben der ursprünglichen publikation zur hand hat.

so weit die theorie. in der praxis sieht es allerdings nochmals anders aus…

eine schwierigkeit ist, dass man in manchen fällen nur schwer zwischen nachdruck und neuauflage unterscheiden kann. die nachdrucke sind in der regel “unveränderte nachdrucke”, aber eben nicht immer: zum teil gibt es auch solche nachdrucke, bei denen einige dinge korrigiert wurden. in diesem fall handelt es sich ja beim neudruck um eine “bessere” version, und man kann durchaus argumentieren, dass diese nun die massgebliche, zu zitierende fassung sei. man will ja nicht noch die fehler der letzten gültigen auflage zitieren, wenn bereits ein korrigierter druck erschienen ist, richtig?

ob es sich bei einem nachdruck um einen “unveränderten” handelt, ist in gewissen fällen nur schwer herauszubekommen. häufig findet man nur jahreszahlen beim copyright-vermerk, ohne dass ganz klar wäre, ob sich zwischen den drucken etwas geändert hat (“(c) 1976, 1985, 2001”).

umgekehrt trifft man immer wieder neuauflagen, wo man im impressum/vorwort erfährt, dass es sich in tat und wahrheit lediglich um einen nachdruck handelt. wieso ein solcher titel dann überhaupt als neuauflage deklariert wird, kann man sich zu recht fragen.

eine besondere knacknuss, mit der ich es vor kurzem zu tun hatte, ist das schwedische etymologische wörterbuch von elof hellquist. versionen davon sind mindestens in folgenden jahren erschienen: 1922, 1939, 1948, 1966, 1980. im druck von 1948 erfährt man im vorwort folgendes:

TREDJE UPPLAGAN
utgör ett oförändrat omtryck av andra upplagan. Vid denna omtryckning ha tryckfel rättats och smärre ändringar gjorts.
Lund i oktober 1948. C. W. K. Gleerups förlag

die dritte auflage ist also offenbar nichts anderes als ein “unveränderter neudruck” der zweiten auflage. gleichzeitig erfährt man aber, dass druckfehler verbessert und kleinere änderungen vorgenommen wurden – also doch kein “unveränderter neudruck”!

noch seltsamer wird es, wenn man den eintrag im vorwort des drucks von 1980 (meines wissens der neueste) vergleicht:

TREDJE UPPLAGAN
I denna fjärde tryckning har ett antal smärre tryckfel rättats.
Lund i januari 1980. LiberLäromedel Lund

(eigenartig ist übrigens, dass zwar die vorworte zur ersten und zweiten auflage mitabgedruckt sind, die notiz von 1948 aber entfernt wurde).

im jahr 1980 wurden also ebenfalls nur kleinere druckfehler verbessert, doch diesmal hat man entschieden, das ganze nicht als 4. auflage sondern “nur” als neudruck der 3. auflage zu deklarieren. damit verwischen natürlich die grenzen zwischen beidem vollends…

wenn man sich nun fragt, welche dieser versionen man zu zitieren hat, ergibt sich folgendes dilemma:

gemäss üblicher richtlinie hat man stets die neueste auflage zu zitieren, und das wäre in diesem fall die 3. auflage von 1948; will man die “korrekteste” fassung zitieren, dann muss man sich an die von 1980 halten (3. auflage, 4. druck von 1980, mit verbesserung von druckfehlern); sieht man sich jedoch dem prinzip verpflichtet, die jahreszahl anzugeben, die den forschungsstand anzeigt, müsste man noch die 2. auflage von 1939 zitieren, da sich die 3. auflage als “nachdruck” der 2. auflage ohne inhaltliche änderungen entpuppt hat…

mit schneller, gross genuger festplatte

Linguistik — 21. Apr 2011

gross genuger?

für die meisten muttersprachler tönt diese formulierung wohl ziemlich schief. eine suche im www zeigt jedoch, dass sie gar nicht so selten ist: für gross genuger findet google 78 treffer, für gut genuger (schauspieler/tänzer/coach/…) 170 stück, und für genuger alleine sogar >3,800. nun eignet sich das www bekanntlich nur bedingt als corpus, aber die zahlen sind doch so hoch, dass es sich um mehr als nur einige zufallstreffer handeln muss.

stein des anstosses für unser sprachgefühl ist, dass -er eine adjektivendung ist, die eigentlich nicht an adverbien wie genug angehängt werden kann. sie bezeichnet im konkreten fall den dativ singular eines femininen, bestimmten adjektivs. es heisst langer, gelber, krummer, aber nicht †gerner, †balder, †allerdingser oder eben †genuger. die konstruktion entbehrt aber nicht einer gewissen grammatischen logik: hier wurde anstelle von gross die durch ein adverb modifizierte variante gross genug eingesetzt, folglich muss es im dativ nicht gross-er sondern [gross genug]-er heissen.

das beispiel zeigt, dass flexion keineswegs auf einzelne wörter beschränkt ist. offenbar können die sprecher auch eine ganze phrase, wenn sie syntaktisch die funktion eines adjektivs hat, wie ein adjektiv flektieren.

dieses zunächst vielleicht überraschend wirkende phänomen entpuppt sich im sprachvergleich allerdings nicht als etwas aussergewöhnliches – es gibt diverse parallelfälle, von denen ein besonders bekannter der englische genitiv ist. im englischen heisst es:

John’s sandwich
my mother’s sandwich
the king and queen of Sweden’s sandwich

aus den beispielen geht ganz klar hervor, dass sich der ‘s-genitiv jeweils auf die gesamte nominalphrase und nicht bloss auf ein einzelnes substantiv bezieht:

[John]’s sandwich
[my mother]’s sandwich
[the king and queen of Sweden]’s sandwich

aus diesem grund haben manche forscher gemeint, es handle sich dabei gar nicht mehr um einen kasus (genitiv) sondern um eine allgemeinere form von possessivmarkierung. doch wieso sollte sich eine kasusmarkierung bloss auf ein einzelnes substantiv beziehen können? die neubewertung des englischen genitivs als possessivmarker erscheint mir unnötig.

man kann sich denken, dass diese formulierungen im englischen zunächst einen ähnlich zweifelhaften status hatten wie heute gross genuger im deutschen. heute sind sie allerdings allgemein akzeptiert und werden in jeder englischen grammatik beschrieben.

im deutschen sind gross genuger und gut genuger derzeit sicher selten und würden von vielen muttersprachlern (und vielen lehrpersonen ;] ) vermutlich als “falsch” abgelehnt. aber die konstruktion füllt eine echte lücke (wie würde man es sonst sagen? mit gross genug seiender festplatte?) und es spricht im prinzip nichts dagegen, dass sie sich dereinst im deutschen ausbreiten und zu einer geläufigen und allgemein akzeptierten ausdrucksweise werden könnte.

update 23. mai 2011
ich wurde freundlicherweise darauf hingewiesen, dass es bei henzen (deutsche wortbildung, 3. auflage, tübingen 1965) §167.5 weitere (z.t. dialetktale) beispiele für adverbien gibt, die zu adjektiven umfunktioniert wurden: ein teilweiser erfolg, schrittweises vorgehen, mit kaumer not. mein persönlicher liebling ist ein ab-er knopf (= ein knopf, der ab ist).

während

Etymologie,Linguistik — 8. Apr 2011

nun noch zur präposition/konjunktion während. die entstehung dieses wortes wird dann verständlich, wenn wir es mit dem heute etwas altmodisch klingenden und eher selten gebrauchten verb währen im sinn von ‘(an)dauern’ in verbindung bringen, z.B. in der krieg währte dreissig jahre. ist diese verbindung einmal etabliert, kann während formal problemlos mit dem präsenspartizip zu diesem verb identifiziert werden (so wie spielend zu spielen oder singend zu singen). wie aber kann es dazu gekommen sein, dass sich auf grundlage eines präsenspartizips eine präposition/konjunktion entwickelt hat?

vermutlich hat man an formulierungen wie in der zeit währender kriege oder nach dreissig jahre währendem krieg zu denken, die als in der zeit während der kriege bzw. während dem krieg missverstanden werden konnten. man hat also wohl aufgrund einer falschen segementierung gemeint, bei den wortauslauten -der und -dem handle es sich um den bestimmten artikel. in dieser analyse musste während als eine temporale präposition erscheinen, und als solche kam sie dann auch in allgemeinen gebrauch.

auch im fall von während ist es also möglich, durch den vergleich mit daten aus der gegenwartssprache, in diesem fall konkret durch die anknüpfung an das verb währen ‘(an)dauern’, etwas über die geschichte des wortes zu erfahren.

dieser beitrag beschliesst meine mini-serie zur etymologie.

referenzen
kluge, f. & seebold, e. (2002): etymologisches wörterbuch der deutschen sprache. berlin. 24. auflage.
pfeifer, w. (1997): etymologisches wörterbuch des deutschen. münchen. 3. auflage.

fertig

Etymologie,Linguistik — 1. Apr 2011

ein etwas schwierigerer fall ist fertig. die meistens muttersprachler können das wort vermutlich spontan nicht direkt an anderes wortmaterial anschliessen. dennoch ist die erklärung des wortes eigentlich relativ naheliegend; als hindernis entpuppt sich vor allem die orthographie. hält man sich einmal die (hochdeutsche) aussprache vor augen (bzw. ohren), ist es nicht allzu schwierig, auf eine verbindung zu fahren, fahrt und fähre zu schliessen. würde das wort (etymologisch richtig) fährtig geschrieben, wäre der zusammenhang sogar offensichtlich. das wort hängt mit fahren oder genauergesagt mit dem abstraktum fahrt zusammen: es ist ein von letzterem abgeleitetes adjektiv mit der ausgangsbedeutung ‘zur fahrt bereit, beweglich’. man kann sich vorstellen, dass es zunächst für einen zur abfahrt bereit gemachten wagen, eine zu transportierende ware, eine reisebereite person oder etwas in der art benutzt wurde, bevor es in seiner bedeutung verallgemeinert und für ‘bereit’ im generellen sinn, später auch für ‘abgeschlossen’ oder ‘erledigt’ verwendet wurde.

die verbindung zu einer bedeutung ‘befördern, transportieren’ zeigt sich noch in dialektalem sprachgebrauch. im bündner-walserischen etwa gibt es heute noch das gängige verb fergge(n) im sinn von ‘bringen, befördern’. dieses muss von fertig abgeleitet worden sein, als es noch die ältere bedeutung ‘transportbereit’ hatte. das neuhochdeutsche fertigen, das ihm strukturell genau entspricht, bedeutet dagegen ‘herstellen’ und stammt folglich aus einer zeit, wo fertig bereits den übergang von ‘zur fahrt bereit’ zu ‘bewerkstelligt, fertig, gemacht’ vollzogen hatte.

nächste woche: während.

lesen und auflesen

Etymologie,Linguistik — 17. Mar 2011

im anschluss an den letzten beitrag zum wort bisschen versuche ich wiederum an einem beispiel zu zeigen, wie man durch nachdenken über die sprache etwas über ihre geschichte lernen kann. diesmal geht es um das wort lesen ‘schrift interpretieren’. für sich alleine genommen verrät es wenig über seine herkunft, doch gibt es verwandtes wortmaterial, das uns erahnen lässt, wie lesen zu seiner heutigen bedeutung gekommen sein kann. ich denke dabei an die wörter auflesen und auslesen. in diesen zwei verben steckt offensichtlich das selbe wort -lesen drin, jeweils mit einer vorsilbe (präfix) versehen. die bedeutung unterscheidet sich aber grundlegend. mit der interpretation von schrift hat weder auflesen noch auslesen etwas zu tun – stattdessen geht es hier darum, ‘etwas vom boden aufzunehmen, aufzusammeln’ bzw. ‘etwas auszuwählen, etwas (aus einer menge) herauszupicken’. angenommen, die präfixbildungen hätten eine ältere bedeutung bewahrt, ergibt sich für das verb lesen ein anschauliches bild: nämlich das ‘aufnehmen’ oder ‘aufsammeln’ von buchstaben und wörtern. und tatsächlich eklären sich die etymologen die bedeutungsentwicklung des wortes auf diese oder eine ähnliche weise. dabei dürfte auch das lateinische verb legere eine rolle gespielt haben, das ein ganz ähnliches bedeutungsspektrum hatte und damit im verdacht steht, das vorbild für das deutsche lesen im sinn von ‘schriftzeichen interpretieren’ gewesen zu sein.

auch in anderen fällen lässt sich zeigen, dass präfixverben eine ältere wortbedeutung bewahren, während das wort, wo es ohne präfix vorkommt, einen bedeutungswandel durchgemacht hat. zum beispiel dürfen. das wort ist heute ein modalverb, das in erster linie im bedeutungsfeld ‘erlaubnis haben’ anzusiedeln ist. dass es nicht immer diese bedeutung gehabt hat, zeigt das präfixverb bedürfen – es weist auf eine ausgangsbedeutung ‘nötig haben’, die auch vom abgeleiteten substantiv bedarf und vom adjektiv bedürftig gefordert wird. übrigens hängt auch darben ‘mangel leiden’ damit zusammen, wenn auch die verwandtschaft in diesem fall etwas weniger direkt ist. dürfen hat also eine bedeutungsveränderung von ‘nötig haben’ zu ‘erlaubnis haben’ erfahren, die sich vermutlich in negierten sätzen entwickelte (‘hat nicht nötig’ → ‘muss nicht, soll nicht’ → ‘hat keine erlaubnis zu’). bedürfen hat dagegen den älteren stand bewahrt.

damit ist gezeigt, dass die bedeutungsentwicklung von lesen durch einen vergleich mit den präfixverben auflesen und auslesen erschlossen werden kann, weil die präfixverben eine ältere bedeutung erhalten haben – ein phänomen, für das sich bei dürfen und bedürfen eine parallele fand.

nächste woche: fertig.

bisschen und schlückchen

Etymologie,Linguistik — 4. Mar 2011

jeden tag verwenden wir sprache, ohne gross darüber nachzudenken, was es mit den wörtern und sätzen, die wir gebrauchen, auf sich hat. warum sagen wir so und nicht anders? im alltag ist diese frage unwichtig – sprache ist konvention, und als solche können wir sie nutzen, ohne sie zu hinterfragen.

wer sich aber die zeit nimmt, über seine sprache nachzudenken, kann einiges über sie und ihre geschichte in erfahrung bringen. es ist sogar recht erstaunlich, wie weit man ganz ohne etymologische wörterbücher und historische grammatiken kommt (obwohl – wer es genau wissen will kommt um diese natürlich nicht herum).

nehmen wir das wort bisschen. bei genauerem hinsehen ist das wort für jeden muttersprachler völlig durchsichtig: es ist eine verkleinerungsform mit -chen zu einem substantiv biss, das seinerseits vom verb beissen abgeleitet ist. die ursprüngliche bedeutung lässt sich als ‘kleiner bissen’ erschliessen. wie aber kommt es zur heutigen verwendung als adjektiv oder adverb mit der bedeutung ‘eine kleine menge’ (ein bisschen geld) oder ‘in geringem mass’ (ein bisschen zu spät)? auch dies ist nicht schwer zu erkennen: die heutige verwendung von bisschen wird ihren ursprung in sätzen gehabt haben, wo es um eine kleine menge von etwas essbarem ging, z.b. ein bisschen brot oder ein bisschen torte. in solchen sätzen konnte das wort bisschen statt als ‘ein kleiner bissen’ auch schlicht als eine ‘eine kleine menge von etwas’ aufgefasst werden, und dies erlaubte, das wort auch für ein bisschen wasser oder ein bisschen zeit zu verwenden, obwohl dort der bezug zu ‘beissen’ nicht mehr gegeben war. von dort war es nur noch ein kleiner schritt, das wort auch für tätigkeiten zu gebrauchen, die ‘in geringem mass’ stattfanden (ich fror ein bisschen).

man kann sich vorstellen, dass etwas paralleles auch mit schlückchen hätte passieren können, d.h. dass man ausgehend von phrasen wie ein schlückchen wein formulierungen wie ein schlückchen geld oder ich fror ein schlückchen hätte kreieren können. offenbar gab es aber kein bedürfnis dafür, noch ein weiteres wort für ‘eine kleine menge von etwas’ zu schaffen. so befinden wir uns also heute in der etwas paradoxen situation, zwar ein bisschen wein, nicht aber ein schlückchen brot zu uns nehmen zu können.

nächste woche: lesen und auflesen.

swiss german ‘idiotikon’ available online

Etymologie,Linguistik,Uni — 19. Sep 2010

news just reached me that the swiss german ‘idiotikon’ – by far the most extensive lexical ressource of the swiss german dialects – has been made available online. it has already been possible for a while to search the index online, but the search function only returned a pointer to the volume/page of the printed ‘idiotikon’, so that you still had to go to the library to read the article. but now, the results are actually links to scanned pages of the printed work, which are displayed directly in your browser. it’s even possible to move forward/backward from the current page, making it easy to browse the surrounding articles. it seems that the complete work is now accessible online, except the parts which haven’t been edited yet (parts of vol. 16 and vol. 17).

so if you’ve ever wondered what the word Glungge means, whether or not it’s charming to be called a Tubel, or why the word for ‘broom’ features an –m– in some swiss dialects (e.g. Bäsme), you can now easily look it up online.

breaking a cryptogram

on p. 206 of coulmas 1989 book the writing systems of the world, there is an image of the following cryptogram:

cryptogram

apparently, the author had given this encrypted text to some of his grad students, and gave them one week to study it and to find out as much about it as they could. surprisingly, one of the students managed to decrypt it completely in one week, without even knowing that the language of the encrypted text was english.

so, being intrigued by this riddle, i decided to give it a try myself. and i did eventually come up with the correct solution, though it took me a great effort and countless hours… during the process, i named and indexed every symbol of the script, did research on vowel and syllable frequencies, compiled a bunch of statistics, discussed my preliminary findings with various people, and even wrote a html/javascript tool to faciliate the testing of hypotheses :P the trouble was definitely worth it, though, since the feeling you get when the mess of letters before your eyes finally starts to make sense is very rewarding :)

in the following, i’ll explain what approaches i tried, what the largest obstacles were, and how i finally reached the solution. don’t read beyond this point if you want to give it a try yourself!

a few observations could be made right away from simply looking at the cryptogram:

  • there are more symbols than in the roman alphabet, but too few for a syllabary
  • we never find the same symbol twice in a row
  • there is a considerable number of single symbols which occur as words (i.e., between spaces)
  • there are no hyphenation marks, meaning there is either no hyphenation, or it is not indicated
  • because of the layout with a title and an indented first line of the paragraph, the text is clearly to be read left-to-right and top-to-bottom
  • one symbol that was evident was the one after the apostrophe in the title, which clearly had to be /s/

from these observations, i could draw one conclusion with certainty: because of the absence of doubled symbols, it couldn’t be a simple encoding of written english. rather, it was likely to be an encryption based on spoken english.

besided that, i faced a number of problems:

  • the amount of symbols (48) was certainly too low for a syllabary (since english has complex syllable codas, we’d expect at least 150), but surprisingly large for the amount of phonemes of english (usually assumed to be around 30). guessing that long vowels might be encoded separately, and that phonemes like the glottal stop /ʔ/ and possibly affricates like /tʃ/ might have their own symbols, it seemed possible to reach a number of phonemes as high as about 40. but 48 just seemed too high.
  • the high number of symbols, together with the high amount of 6 different symbols occurring alone, made me think that at least some of the symbols must represent a syllable rather than a phoneme. the only english word i could think of that consists of only one phoneme is the indefinite article a. it might be possible to reach more when counting diphthongs (personal pronoun i) and interjections (oh, ah etc.), but at least the latter seemed an unlikely assumption. this paradox was in fact a main obstacle for breaking the cryptogram, since i frequently discarded my attempts of assigning sounds to symbols when it resulted in some of the single symbols being assigned values like t or n, which are not words of the english language by any account.
  • because of the insufficient quality of the printed image, i was unsure about the reading of some signs. especially in the title, some symbol shapes were not properly printed, leading to some problems (how do we decide if small differences in appearence are significant? are we dealing with graph variants, or separate graphemes?), and the punctuation marks were overall hard to judge (comma or period?). if you check the list of symbols below, you will even notice that i listed one symbol (“ascending-spike”) which in fact turned out to be not a separate letter of the alphabet, but identical with the symbol “ascending-bent”, modified by a printing stain.

to make any progress, i decided that i needed to name and index all the symbols, so that i could make a transcript of the cryptogram and start compiling some statistics. here’s the list with names:

symbol names

using standard unix commands like sed, uniq and sort, as well as some regular expression magic, it was quite easy to compile statistics of 1) symbol frequencies 2) word frequencies 3) frequency list of symbols occurring in the beginning of words 4) frequency list of symbols occurring in the end of words.

but what could these statistics be compared to? i clearly needed some data about spoken english. luckily, i found a large transcript of a british english text on the internet, and i used it to compile similar statistics to the ones mentioned above, so that they could be compared easily.

thanks to that, i came up with some guesses of possible symbol – sound correlations. but how could i verify/falsify them easily? it seemed too tiresome to use a pencil and an eraser every time. that’s why i wrote a small HTML/javascript application that would substitute letters automatically and quickly. you can see it here (it’s actually still a bit buggy, but it was good enough for what i needed it).

one of the early ideas i had was that the sign i called “q” might have the value /ð/. the reason for that was that it was very frequent in anlaut, but never occured in auslaut, which matched the distribution of /ð/ in english.

but this – again – let to the problem that /ð/ is no word of the english language (not even in fast talk). this made me reconsider this guess repeatedly, even though it turned out to be correct in the end.

the breakthrough was then made possible by two observations. first, the second to last word in the title consisted of two symbols, and it was in the position right before a name. therefore, it was likely to be either an article or a preposition. i also spotted the same sequence in a frequent three-symbol word (being identical to symbol two and three in that word). so i checked the list of most frequent words in english to see if i could find a word consisting of three phonemes, where the phonemes two and three together would be identical to an article or a preposition. and i did in fact find one (actually, more than one, but this one seemed most promising): /ðæt/ and /æt/. since this fitted also with my guess that the “q” symbol might be /ð/, i felt that this was a good path to explore. with that, i was in fact already on the right track.

second, i noticed two sequences where /ðæt/ was followed by another word of length three, and they both started with /ð-/. these were likely to be one of /ðæt ðei/, /ðæt ðer/, /ðæt ðis/ or /ðæt ði:z/, and it turned out that the latter two fitted well. with that, i saw the hypothesis confirmed that long vowels were represented by separate symbols. in addition, i discovered that “it iz” had appeared in other parts of the cryptogram, giving me some confidence that i was going in the right direction.

next, i concentrated on a frequent two-symbol word ending in long /i:/, and i came to the conclusion that a /w/ would fit best for the first symbol. the sequence /w?t/ was then likely to be /wɒt/.

in the meantime, it had finally dawned on me how to read the single-letter words: it had to be the case that the most frequent functional words were given only by their characteristic consonant. therefore, /t/ was /to/, /ð/ was /ðə/, and one of the remaing ones had to be /n/ = /ænd/.

with these letters given, i managed to guess /wi: kænɒt/, occurring thrice in the first line, and this couldn’t possibly be a coincidence. so from there on forward, it wasn’t too hard anymore to guess the remaining symbols, though i admittedly didn’t get some of the symbols which represent a syllable (there were in fact a few of those in the alphabet, just as i had suspected based on the total number of symbols).

later, after decrypting the entire text, i found out that this script is in fact real. it’s known under the name of the shavian alphabet (check that link for the values of all the signs), and it was created at the occasion of a contest to invent an improved orthography for english (though it never became popular, for obvious reasons).

cryptogram
[the colored areas were crucial for the deciphering: blue – /æt/ and /ðæt/, green – /ðæt ði:z/ and /ðæt ðis/, orange – /wi:/]

the text turned out to be a part of lincoln’s gettysburg address. in full:

From Lincoln’s speech at Gettysburg

But, in a larger sense, we cannot dedicate…we cannot
consecrate…we cannot hallow…this ground. The brave men,
living and dead, who struggled here, have consecrated it
far above our poor power to add or detract. The world
will little note nor long remember what we say here, but
it can never forget what they did here. It is for us, the
living, rather, to be dedicated here to the unfinished
work which they who fought here have thus far so nobly
advanced. It is rather for us to be here dedicated to the
great task remaining before us…that from these honored
dead we take increased devotion to that cause for which
they gave the last full measure of devotion; that we here
highly resolve that these dead shall not have died in vain;
that this nation, under God, shall have a new birth of
freedom; and that government of the people, by the people,
for the people, shall not perish from the earth. (courtesy wikisource)

references
coulmas, florian: the writing systems of the world. oxford 1989.

onp – ordbog over det norrøne prosasprog

Linguistik,Uni,VGS — 3. Aug 2010

the onp – full name ordbog over det norrøne prosasprog, engl. a dictionary of old norse prose – is a large scale dictionary project based in copenhagen. the project’s goal is to produce a comprehensive dictionary of the prose language of old norse, a goal on which they have been working since the project was started in 1939. so far 3 volumes (a-em) plus a volume of indices have appeared in print. in recent years, however, it seemed that the project was going through some difficult times as it became clear that the printing of new volumes was not going to continue. that is sad news to anyone interested in the old norse language, since the onp was set out to be a tremendous achievement, vastly superiour to any other dictionary of old norse currently in existence. not all is lost, though, with the project apparently shifting its focus on digitizing the material which was so far collected. this new focus has now been confirmed by a news update on the project’s webpage. in fact, it appears that a lot of data has already been made available online. a wordlist allows easy access to information about lexemes, including a list of attested word forms, scans of hand written citation slips and what appear to be scans of printed editions. the web interface also offers useful features like sorting citations chronologically.

onp

onp web interface – earliest attestation of ON røk(k)r

certainly, this isn’t as good as having the dictionary completed in print, but what they offer online is already a very useful ressource and a big leap forward from the heavily outdated dictionaries of cleasby/vigfusson and fritzner.

i can’t tell you in detail how complete the available data is, but judging from some random samples i looked up, it appears to cover the entire alphabet, and the entries certainly seemed useable, even though they are obviously in an “un-edited” state.

information on their web page indicates further that they do have plans to continue employing editors, although i’m now quite sure what and how they will edit / publish.

the web interface didn’t impress me too much (some links won’t open in firefox, weird frame behaviour), but hey, as long as i’m able to access the information i need, you won’t hear me complain.

all in all, this makes me particularly happy for two reasons: first, because it will make my life as a researcher easier (the onp lists full word forms, making it possible to judge the inflectional behaviour of words), and second, because it was about time that the work of the tireless staff at onp was finally made available to a wider audience.

« Previous PageNext Page »