What this project is, and why it matters
ما هذا المشروع، ولِماذا يَهُمّ
في أكثرِ اللُّغات، الحُروفُ رُموزٌ صَوتيّةٌ صِرفة، لا تَحمل في ذاتها مَعنىً، وإنّما تَتَشَكَّل المَعاني حين تُجمَع الحُروفُ في كَلِمات. أمّا العربيّةُ، فعَلى خِلاف ذلك. كلّ حرفٍ من حُروفها الثَّمانية والعِشرين يَحمل في ذاته شَحنةً دلاليّةً مَخصوصة، تَنبَع من شَكل نُطقه: حَركة اللسان، ومَوضع الصَّوت، وكيفيّة خُروج النَّفَس. ومَعنى كلّ كَلِمةٍ يُبنى تَركيبًا، حرفًا حرفًا، من مَعاني تلك الحَركات. الفِكرةُ بَسيطةٌ في ظاهِرها، لكنّها تُفضي إلى بِناءٍ كامل حين تُؤخَذ مَأخَذَ الجِدّ وتُختَبَر.
الفِكرةُ ليست جَديدة
صاغَها الخليلُ بن أحمد الفراهيديّ في «كتاب العين» قَبل اثني عشر قَرنًا، فرَتَّب المعجمَ كلَّه بِالمَخرَج، من أَقصى الحَلق إلى الشَّفَتَين. الفِكرة عنده أنّ الحَركة الفيزيائيّة لِلنُّطق هي مَنبَعُ الدِّلالة. وصاغَها ابنُ جنّي في «الخصائص» تَحت بابٍ سَمّاه «إمساس الألفاظ أشباه المعاني». ثمّ جاء ابنُ فارس في «مَقاييس اللغة» فأَعطى لِكلّ جذرٍ أَصلًا مَعنويًّا واحدًا. وفي عَصرنا، تَقومُ الأرضيّةُ المعجميّة على «المعجم الاشتقاقيّ المُؤَصَّل» لِلدكتور محمد حسن جَبَل، يَجاوره عَمَل حسن عبّاس على البَصَمات الحِسّيّة لِلحُروف.
ما تَفعله هذه الدراسة
أَخذنا هذا الحَدسَ القَديم لا كَمُسَلَّمةٍ بل كَفَرَضيّةٍ تَستَحقّ الاختبار، وأَجرَينا عليه فَحصًا منهجيًّا امتدّ سَنةً كاملة، قِراءةً قِراءةً، وحَرفًا حَرفًا، ونواةً نواة. واعتَمَدنا المُعجَمَ المَرجِعَ أَرضيّةً تَجريبيّة (28 حرفًا، و453 نواةً ثنائيّة، و2,285 جذرًا ثلاثيًّا)، فهو العَمودُ الفِقريّ لِلبَيانات في هذا الميدان. غير أنّنا لم نَنقُل قِراءاته كما هي. أَجرَينا قِراءاتنا بِاستقلال، فتَقاطَعَت مع المُعجَم في كثيرٍ من المَواضع، وامتَدَّت إلى ثَلاث نتائجَ بنيويّةٍ جَديدة على بِنية العربيّة الداخليّة:
- جدولٌ مُوَحَّدٌ لِشَحَنات الحُروف الـ 28، فيه شَحنةٌ مَخرَجيّةٌ واحدةٌ حاكمةٌ لِكلّ حرف، مع وَصفٍ نُطقيٍّ ومُقابِلٍ إنجليزيٍّ موجَز.
- قاعدةُ الوَجهَين العامّة: كلّ حرفٍ يَحمل وَجهَين دلاليَّين لِنُطقٍ واحد، والحرف الثالث في الجذر هو الذي يُحَدِّد أيَّ الوَجهَين يَعمل. ثَبَتَت بِالاستقراء على النَّوى الـ 453 كلِّها.
- أحد عشر بابًا في تركيب الجذر الثلاثيّ (مع مَدخَلٍ ثاني عشر، الدَّخيل، يَلتَقِط الجذور غير الأصيلة، حالةٌ واحدةٌ من 2,285). النَّواةُ الثنائيّةُ تَعمل في الحرف الثالث وتَتَّخِذ شَحنتَهُ مادّةً لها، في أحد هذه الأبواب. تَنطبق على الجذور الـ 2,285 كلِّها انطباقًا تامًّا من غير تَكَلُّف. وهذه الأبواب أَنفُسها مَفتوحةٌ لِلتَّنقيح: قد تَتَّحِد بعضُها مع بَعض، وقد يَنشَقّ بعضُها إذا كَشَفَت بَياناتٌ جَديدة عن نَمَطٍ لم نَرَه.
ثُمَّ قادتنا هذه النَّتائج إلى سؤالٍ تالٍ: إذا كانت بِنيةُ النُّطق-المَعنى في العربيّة بهذه الشَّفافيّة، فهل أَثرُها يَظهر في الفصائل اللُّغَويّة الأُخرى؟ من هذا السؤال خَرَجَت نتيجةٌ رابعة، مُلحَقة بِالأَصل وقائمةٌ بِذاتها في الوَقت نَفسه:
- ضوابطُ تَحَقُّقٍ مِن أربعةِ شُروط لِلنَّظائر بين اللغات، مُسنَدةٌ إلى قوانين الإبدال الصَّوتيّ التِّسعة عند د. علي فهمي خشيم، اجتازَتها ثَمانية أزواجٍ راسخةٍ قُرآنيًّا (كفء ↔ copy، سلام ↔ shalom، ربّ ↔ rabbi، جنّ ↔ genie، وغيرها). تَفصيلُها في القِسم المُخَصَّص لِما بين اللغات أَسفل هذه الصَّفحة.
السؤالُ الأَعمَق
هل العَلاقة بين أصوات الكَلِمة ومَعناها اعتباطٌ مَحض؟ أم في الأَمر بناءٌ مَخصوص؟ هذا سؤالٌ قَديم في الفلسفة الغَربيّة، طَرَحَه أَفلاطون في مُحاوَرة «كراتيلوس» قَبل ألفَين وأربعمائة عام، وحَسَمَه فيرديناند دي سوسير في مَطلع القَرن العِشرين بِالاعتباطيّة، فصارت أُسّ اللسانيّات الحديثة. غير أنّ كثيرًا من اللغويّين بَعده وَجَدوا في الإجابة قُصورًا. عَمِل إدوارد سابير ورومان ياكوبسون على الرَّمزيّة الصوتيّة. ووَضَع جون أوهالا ما سَمّاه «شِفرة التَّردُّد» التي تَربط الصَّوت الحادّ بِالصِّغر والثَّقيل بِالكِبَر. ووَسَّع جورج لايكوف هذا الباب نحو الإدراك المُجَسَّد. وفي السَّنوات الأخيرة، عَمِلَت أَسيفا مَجد على الحَواسّ في اللُّغة عبر الفصائل اللغويّة. لكنّ ما عند هؤلاء جَميعًا شَواهدُ مُتَناثِرة، لم تَبلُغ يَومًا الشُّمولَ المنهَجيَّ الذي تُتيحه العربيّة.
والتَّقليدُ العربيّ القَديم، قَبل سوسير باثني عشر قَرنًا، أَجاب الجَوابَ المُعاكِس صَريحًا: بِنيةُ المعنى مَوصولةٌ بِبِنية النُّطق. وهذه الدراسةُ تُقَدِّم أَوّل اختبارٍ تَجريبيٍّ مُنَهَّج وواسع لِدَعوى الاعتباطيّة، على لُغةٍ تَحمل بِنيةَ الجذر الشَّفّافة.
ولِذلك يَهُمّ هذا في خَمسة مَيادين
- لِلدراسات العربيّة والقُرآنيّة: قراءاتٌ على مَستوى الآية، مُسنَدةٌ إلى عِلم المَخارج والصِّفات، لا إلى التَّقليد التَّفسيريّ وَحدَه.
- لِعِلم اللُّغة العامّ: أَوّل اختبارٍ تَجريبيٍّ واسعٍ لِدَعوى الاعتباطيّة، على لُغةٍ بِبِنية جَذرٍ شَفّافة.
- لِلسانيّات المُقارَنة: ضوابطُ تَحَقُّقٍ مُنضَبِطة تُمَيِّز النَّظائر الحَقيقيّة من التَّشابُهات السَّطحيّة.
- لِلسانيّات الحاسوبيّة والذَّكاء الاصطناعيّ: جَبرٌ تَركيبيٌّ شَفّافٌ لِمعنى الجذر، لا تَبلُغُه نَماذجُ التَّضمين العَصَبيّة وَحدَها. اللُّغة على هذه القراءة رياضيّاتٌ صَوتيّةٌ وخوارزميّاتٌ مَعنويّة.
- لِلتَّقليد العربيّ القَديم نَفسِه: ثِقةٌ مُجَدَّدة في ما بَدأه الخليلُ، بِأَدوات القَرن الحادي والعِشرين.
In most languages, letters are pure sound-tokens, arbitrary symbols that mean nothing on their own; meaning emerges only when they are assembled into words. Arabic does not work that way. Each of its 28 letters carries a specific semantic charge, drawn from the physical gesture of pronunciation itself: where the tongue sits, where the breath stops, where the sound is produced in the mouth. The meaning of every word is built compositionally, letter by letter, from the meanings of those gestures. The principle is simple at its root, but it opens a wide door when taken seriously and tested.
The idea is not new
Al-Khalil ibn Ahmad al-Farahidi shaped it in Kitab al-Ayn twelve centuries ago, ordering the entire dictionary by place of articulation, from deep in the throat forward to the lips. The principle for him was that the physical gesture of pronunciation is itself the wellspring of meaning. Ibn Jinni framed the same idea in al-Khasais under a chapter he called «إمساس الألفاظ أشباه المعاني»: letters touch upon resemblances of meanings. Ibn Faris in Maqayis al-Lugha assigned every Arabic root a single core semantic value. In our own era, the lexicographic foundation rests on Dr. Muhammad Hassan Jabal's al-Mu'jam al-Ishtiqaqi al-Mu'assal, alongside Hassan Abbas's parallel work on the sensory profiles of letters.
What this study does
We took the old intuition not as given but as a hypothesis worth testing, and put it through a year of systematic empirical examination, reading by reading, letter by letter, nucleus by nucleus. The reference lexicon (28 letters, 453 binary nuclei, 2,285 trilateral roots) served as the empirical backbone, the most complete dataset of its kind. We did not transcribe its readings, though. We conducted our examination independently, and our results converged with the corpus across much of what he had already established, then extended in three new structural directions on the internal architecture of Arabic itself:
- A unified 28-letter charge table, with one ruling charge per letter, plus a phonetic note and an English gloss for every entry.
- The general dual-face rule: every letter carries two semantic faces of the same physical articulation, and the third letter of a trilateral root selects which face is active. Established by induction across all 453 binary nuclei.
- Eleven native composition modes for trilateral roots (with a twelfth label, LOANWORD, reserved for non-native borrowings, 1 case in 2,285). The binary nucleus operates on the third letter, taking its charge as material, in one of these closed modes. All 2,285 trilaterals fit, without forcing. The eleven modes themselves remain open to refinement: some may collapse together, others may split further, as new data reveals patterns we have not yet seen.
These three results then led us to a further question: if the articulation-meaning structure inside Arabic is this transparent, does it leave traces in other language families? That question produced a fourth result, related to the first three but standing on its own architecturally:
- A four-bar verification rubric for cross-linguistic cognates, anchored by Dr. Ali Fahmi Khshim's nine sound-substitution laws, with eight Quran-anchored Tier-A pairs that pass it (kufu' ↔ copy, salām ↔ shalom, rabb ↔ rabbi, jinn ↔ genie, and others). The full development is in the cross-linguistic section below.
The deeper question
Is the link between the sounds of a word and its meaning entirely arbitrary, or is there a structure? The question is old in Western philosophy: Plato posed it in the Cratylus dialogue twenty-four centuries ago. Ferdinand de Saussure settled it at the beginning of the twentieth century with the principle of arbitrariness, which then became foundational for modern linguistics. Many later linguists, however, found the answer incomplete. Edward Sapir and Roman Jakobson worked on sound symbolism. John Ohala proposed the "frequency code" that ties high-pitched sounds to smallness and low-pitched sounds to size. George Lakoff opened the door to embodied cognition. In recent years Asifa Majid has worked on sensory linguistics across language families. Their evidence is suggestive, but scattered, and never reaches the systematic scale Arabic permits.
The classical Arabic tradition gave the opposite answer to Saussure twelve centuries before him, explicitly: meaning-structure is bound to articulation-structure. This study offers the first systematic, large-scale empirical test of the arbitrariness thesis, on a language whose root morphology remains transparent.
Why it matters, in five domains
- Arabic and Quranic studies: verse-level readings grounded in the science of articulation, not in interpretive tradition alone.
- General linguistics: the first systematic empirical test of the arbitrariness thesis at scale, on a language with transparent root morphology.
- Comparative linguistics: a disciplined verification rubric that separates genuine cross-linguistic resonance from surface accident.
- Computational linguistics and AI: a transparent compositional algebra for root-level meaning that neural embedding models cannot reach. On this reading, language is acoustic mathematics and semantic algorithms.
- The classical Arabic tradition itself: a renewed standing for what al-Khalil began, now tested with the tools of the twenty-first century.
Nine things this study has settled
تِسعةُ أَشياءَ حَسَمَتها هذه الدِّراسة
Arabic is not a list of words a culture happened to coin. It is a phonetic system that builds meaning from the way the mouth moves, and we can now show this empirically, on real data, with predictions made in advance. The same system shows up across distant languages, and shows up even more cleanly in Arabic's close family (Egyptian, Hebrew, Aramaic). And the Qur'an, when tested word by word, contains no borrowings. Each finding below links to the audit that backs it up.
العَرَبيّةُ ليسَت قائمةَ كَلِماتٍ سَكَّتها ثَقافةٌ صُدفةً. هي نِظامٌ صَوتيٌّ يَبني المَعنى مِن طَريقةِ حَرَكة الفَم، ويُمكِنُنا الآنَ إِثباتُ ذلك تَجريبيًّا، عَلى بَياناتٍ حَقيقيّة، بِتَنبُّؤاتٍ تُسَجَّل مُسبَقًا. النِّظامُ نَفسُه يَظهَرُ في لُغاتٍ بَعيدة، وَيَظهَرُ أَنظَفَ بَعد في أُسرةِ العَرَبيّةِ القَريبة (المِصريّة، العِبريّة، الآراميّة). وَالقُرآنُ، حِينَ يُختَبَرُ كَلِمةً كَلِمة، لا يَحوي دَخيلًا. كُلُّ نَتيجةٍ أَدناهُ مَوصولةٌ بِالتَّدقيقِ الذي يَدعَمُها.
Every Arabic letter carries meaning كُلُّ حَرفٍ عَرَبيٍّ يَحمِلُ مَعنى
Each letter carries a charge drawn from where the mouth makes it, not an empty sound. The bāʾ sticks. The rāʾ runs. The qāf cuts. The mīm gathers. And every letter has a soft face and a hard face, depending on its neighbours. This is the rule for all twenty-eight letters, with no exception.
كُلُّ حَرفٍ يَحمِلُ شَحنةً مُستَمَدّةً مِن مَوضِعِ نُطقِه، لا صَوتًا فارِغًا. الباءُ تُلصِق. الراءُ تَجري. القافُ تَقطَع. الميمُ تَجمَع. ولِكُلِّ حَرفٍ وَجهانِ، ناعِمٌ وخَشِن، حَسَب مُجاوِريه. هذه قاعدةُ الثَّمانية والعِشرين كُلِّها، بِلا استِثناء.
Two letters form a meaning-seed حَرفان يَصنَعانِ بِذرةَ مَعنى
When two letters meet, they make a binary nucleus. K + L = "the extending enclosure" (in kalām, kalb, kalima). J + M = "gathering into a mass" (in jamaʿ, jamāl, jamīʿ). The third letter joins and shapes how the seed acts, in one of eleven distinct ways. Eleven, not three, not twenty. These eleven cover every Arabic root without forcing.
عِندَما يَجتَمِعُ حَرفان، يَصنَعانِ نَواةً ثُنائيّةً. ك+ل = «الإحاطةُ المُمتَدّة» (في كَلام، كَلب، كَلِمة). ج+م = «الجَمعُ في كُتلة» (في جَمَع، جَمال، جَميع). الحَرفُ الثالِثُ يَنضَمّ فيُشَكِّل كَيف تَعمَلُ البِذرة في أَحَدِ أَحَدَ عَشَرَ بابًا. أَحَدَ عَشَرَ، لا ثَلاثة، لا عِشرون. هذه الأَحَدَ عَشَر تَكفي لِكُلِّ الجُذور العَرَبيّة بِلا تَكَلُّف.
Arabic and Indo-European share deep roots العَرَبيّةُ والهندوأوربيّةُ تَتَشاركانِ جُذورًا عَميقة
These are preserved conceptual families in the consonant skeleton, not late borrowings. Kalām ↔ clamare / claim: the same voice-extended-under-constraint. Qarn ↔ horn / corn (Welsh): the same hard sharp projection. Sabt ↔ Sabbath: across three Indo-European branches. The mainstream comparative philology missed this because it assumed Semitic and Indo-European were already separate when the parallels formed. They are not.
هي عائلاتٌ مَفاهيميّةٌ مَحفوظةٌ في الهَيكَلِ الصامِتيّ، لا استِعاراتٌ مُتَأَخِّرة. كَلام ↔ clamare/claim: نَفسُ الصَّوتِ المَمدودِ تَحت قَيد. قَرن ↔ horn / الوِلزيّة corn: نَفسُ النَّتوءِ الصُّلب الحادّ. سَبت ↔ Sabbath: عَبر ثَلاثةِ فُروعٍ هندوأوربيّة. الفيلولوجيا الغَربيّة المُقارِنة فاتَتها هذه الطَّبَقة لأَنّها افتَرَضَت أَنّ السامِيّةَ والهندوأوربيّةَ كانَتا مَفصولَتَين قَبل أَن تَتَكَوَّن هذه الجِنَاسات. ليسَتا كَذلك.
Every Qur'anic word is native Arabic, none of it borrowed كُلُّ كَلِمةٍ في القُرآنِ عَرَبيّةٌ أَصيلة، لا دَخيلَ فيها
Twenty-seven words flagged by orientalists as borrowings into Arabic (firdaws, qamīṣ, injīl, qalam, qirṭās, ṭāghūt, majūs, zanjabīl, and others) were re-read under our grammar, letter by letter. All twenty-seven (100%) resolve as native Arabic, or as reverse-borrowings from Arabic into the neighbour language, or as words preserved jointly with neighbours of the same era. The last two that resisted (majūs, zanjabīl) turned out to be morphological misreadings: majūs is a trilateral on وزن فَعول, zanjabīl a native compound (زَنّ + جُبَيل · "the small molded knob that emits a sharp zing") on the same pattern as Baalbek and Hadramawt. Centuries of "loanword" claims dissolve when each word is read under a disciplined native grammar.
سَبعةٌ وعِشرونَ كَلِمةً وَسَمَها المُستَشرِقونَ كَـدَخيلٍ في العَرَبيّة (فِردَوس، قَميص، إنجيل، قَلَم، قِرطاس، طاغوت، مَجوس، زَنجَبيل، وغَيرها) أُعيدَ قِراءَتُها تَحت نَحوِنا حَرفًا حَرفًا. السَّبعةُ والعِشرونَ كُلُّها (100%) تَنحَلّ إلى عَرَبيٍّ أَصيل، أَو إلى استِعارةٍ عَكسيّةٍ مِن العَرَبيّة، أَو إلى كَلِماتٍ مَحفوظةٍ بَينَها وَجِيرانِها في الحِقبة نَفسِها. الحالَتانِ اللَّتانِ قاوَمَتا (مَجوس، زَنجَبيل) تَبَيَّنَ أَنّ كِلتَيهِما خَطأُ قِراءةٍ صَرفيّة: مَجوس ثُلاثيٌّ على وَزن فَعول، وزَنجَبيل مُرَكَّبٌ أَصيل (زَنّ + جُبَيل · «النُّتوءُ الصَّغيرُ المَصبوبُ يَنفُذ مِنه وَخزٌ حادّ») على عَين نَمَط بَعلَبَك وحَضرَموت. قُرونٌ مِن دَعاوى «الدَّخيل» تَتَلاشى حين تُقرَأ كُلُّ كَلِمةٍ تَحتَ نَحوٍ أَصيلٍ مُنضَبِط.
The framework predicts meanings before we look, and the dictionaries confirm them الإطارُ يَتَنَبَّأُ بِالمَعنى قَبلَ أَن نَبحَث، والمَعاجِمُ تُؤَكِّد
We picked sixteen two-letter combinations Arabic seems not to use. Before checking any dictionary, the framework predicted what each would mean. Then we searched the deepest classical lexicons. Seven matched our predictions exactly: wakhz (the needle-prick we predicted for w·kh); dhaff (the sharp single-blow cleavage we predicted for dh·f); shadhdh (the deviation-by-piercing we predicted for sh·dh), and four others. The grammar produces real Arabic before anyone tells it.
اختَرنا سِتَّ عَشَرَ تَوليفةً مِن حَرفَين تَبدو غَير-مُستَعمَلةٍ في العَرَبيّة. وقَبلَ أَن نَنظُرَ في أَيِّ مُعجَم، تَنَبَّأَ الإطارُ بِما ستَعنيه كُلٌّ مِنها. ثُمَّ بَحَثنا في أَعمَقِ المَعاجِم الكلاسيكيّة. سَبعٌ طابَقَت تَنبُّؤاتِنا حَرفيًّا: وَخَز (الوَخزُ الذي تَنَبَّأنا بِه لِـ و·خ)؛ ذَفَّ (القَطعُ الحادُّ الذي تَنَبَّأنا بِه لِـ ذ·ف)؛ شَذَّ (الانفِصالُ بِتَخَلُّلٍ الذي تَنَبَّأنا بِه لِـ ش·ذ)، وأَربعٌ أُخرى. النَّحوُ يُنتِجُ عَرَبيّةً حَقيقيّةً قَبل أَن يَقولَها أَحَد.
A tenth correspondence beyond Khshim's nine, surfaced by the corpus قانونٌ عاشِرٌ وراءَ قَوانينِ خشيم التِّسعة، أَظهَرَتْهُ البَيانات
Dr. Ali Fahmi Khshim catalogued nine sound-substitution laws mapping Arabic letters to Indo-European ones (ك ↔ Q, ف ↔ P, ج ↔ G…). Running every confirmed cognate through them, one correspondence his list didn't include kept recurring: ط ↔ t, the emphatic ṭāʾ softening to a plain dental. It is the single most active pattern in the corpus (68 hits, the highest mean score of any). We don't claim it as new to linguistics: de-emphaticization is well known, and showcase words like ṣirāṭ (a Latin loan from strata) and qirṭās (Greek chartēs) are borrowings. The modest, exact result: the data surfaced a tenth recurring correspondence beyond the nine Khshim wrote down.
وَضَع الدكتور علي فهمي خشيم تِسعةَ قَوانينَ لِلإبدال الصَّوتيّ تُقابِلُ بِها حُروفُ العَرَبيّة حُروفَ الهندوأوربيّة (ك ↔ Q، ف ↔ P، ج ↔ G…). وبِتَطبيقِها على كُلِّ جِنَاسٍ مُؤَكَّد، تَكَرَّرَ تَقابُلٌ لم تَضُمَّه قائمتُه: ط ↔ t (تَلِينُ الطاءِ المُفَخَّمةِ إلى دَنتاليٍّ مُرَقَّق)، وهو أَنشَطُ نَمَطٍ في الكَوربَس كُلِّه (68 مَرّةً، أَعلى مُتَوَسِّطِ نُقطةٍ بَينَ كُلِّ الأَنماط). ولا نَدَّعيهِ جَديدًا على اللِّسانيّات: فَتَرقيقُ المُفَخَّماتِ مَعروف، وكَلِماتُ الاستِشهادِ مِثلُ صِراط (مُستَعارةٌ مِنَ اللاتينيّة strata) وقِرطاس (اليونانيّة chartēs) دَخيلة. النَّتيجةُ المُتَواضِعةُ الدَّقيقةُ هي هذه: أَظهَرَتِ البَياناتُ تَقابُلًا عاشِرًا مُتَكَرِّرًا وراءَ تِسعةِ خشيم.
Tested twice by two independent runs, and the strong findings held اختُبِرَ مَرَّتَين بِجَولَتَين مُستَقِلَّتَين، فصَمَدَ القَويّ
Every cognate finding was scored a first time, then re-scored independently by a second blind run applying the same calibrated rubric. Ninety percent of the strong findings survived the second pass. The findings the project headlines are not one rater's judgement; they are structures that two independent runs agree on. Where the second pass disagreed (mostly at the looser borderline), the dashboard shows both scores side by side rather than hiding the disagreement.
كُلُّ نَتيجةِ جِنَاسٍ سُجِّلَت أَوَّلًا، ثُمَّ أُعيد تَسجيلُها مُستَقِلًّا في جَولةٍ ثانيةٍ أَعمى بِنَفس الرُّبريك المُعايَر. تِسعونَ بالمِئة مِن النَّتائج القَويّة نَجَت إعادةَ التَّسجيل. النَّتائجُ التي يَتَصَدَّر بِها المَشروعُ ليسَت حُكمَ مُقَيِّمٍ واحِد؛ بَل بِنيَةٌ تَتَّفِق عَلَيها جَولَتانِ مُستَقِلَّتان. وحَيثُ اختَلَفَتِ الجَولةُ الثانية (في المَنطِقةِ الحَدّيّةِ غالبًا)، تَعرِضُ لَوحةُ الاكتِشافاتِ النُّقطَتَين جَنبًا إلى جَنبٍ بَدَلَ إخفاءِ الاختِلاف.
The framework didn't just match cognates, it revealed hidden ones الإطارُ لم يَكتَفِ بِتَأكيدِ الجِنَاسات، بَل كَشَفَ خَفِيَّها
The strongest evidence isn't the obvious matches; it's the cases where two words looked unrelated until the framework forced the alignment. Three classes surfaced from the 200-entry Afro-Asiatic audit: (1) Metathesis cognates. Arabic lisān (l-s-n) "tongue" looked unrelated to Egyptian ns (n-s) until Coptic ⲗⲁⲥ restored the ل, confirming a single root across letter-order swap. Same for أَنف (ʾ-n-f) ↔ fnḏ (f-n-ḏ). (2) Dual-face L3 swaps. رود/روض differ only at the third letter (د/ض, dental-emphatic family), and both read as the same path-stem under the framework's dual-face rule. (3) Polysemy as proof. Egyptian snt means "tooth, sister, second" all on one nucleus, because the framework's matched-pair-by-shared-fine-source seed delivers all three. None of these would surface from surface-comparison alone. They are real-world demonstrations of the framework's diagnostic power.
أَقوى الأَدِلّةِ ليسَت المُطابَقاتِ الواضِحة؛ بَل الحالاتُ التي بَدَت فيها كَلِمَتانِ غَيرَ مُتَّصِلَتَين حَتّى فَرَضَ الإطارُ المُحاذاة. ثَلاثُ فِئاتٍ سَطَعَت مِن تَدقيقِ الـ 200 مَدخَل الأَفروأَسيويّ: (1) جِنَاساتٌ بِقَلب المَواضِع. العَرَبيّةُ لِسان (ل-س-ن) بَدَت غَيرَ مُتَّصِلةٍ بِالمِصريّ ns (n-s) حَتّى استَعادَت القِبطيّةُ ⲗⲁⲥ اللامَ، فأَكَّدَت جَذرًا واحِدًا عَبرَ قَلب التَّرتيب. ومِثلُه أَنف ↔ fnḏ. (2) إبدالات وَجهَين عَلى L3. رود/روض يَختَلِفانِ في الحَرفِ الثالِثِ فَقَط (د/ض، عائلةُ الأَسنانِ المُفَخَّمة)، وَكِلاهُما يَقرَأ نَفسَ جَذرِ الطَّريق. (3) تَعَدُّدُ الدَّلالاتِ كَدَليل. المِصريّ snt يَعني «سِنّ، أُخت، ثانٍ» كُلَّها عَلى نَواةٍ واحِدة، لأَنّ بَذرة المُماثَلةِ بِالاشتِراكِ الدَّقيقِ تُعطي الثَّلاثةَ. لا واحِدةَ مِن هذه تَظهَر مِن المُقارَنةِ السَّطحيّةِ وَحدَها. هي بَراهينُ مُباشِرةٌ عَلى قُدرةِ الإطارِ التَّشخيصيّة.
The framework reads Ancient Egyptian unmodified, every word on the first try الإطارُ يَقرَأُ المِصريّةَ القَديمةَ دونَ تَعديل، كُلَّ كَلِمةٍ مِن أَوَّلِ مُحاوَلة
Arabic and Ancient Egyptian are close family: both Afro-Asiatic, both sharing an ancestor that predates the cuneiform records. We took 200 word-pairs spanning the full vocabulary spectrum (pronouns, body parts, kinship, motion verbs, action verbs, cognition, adjectives, nature, time, the sacred lexicon) and ran every one through the framework. 199 of 200 read coherently · top-three-tier hit-rate 55% and climbing (was 52%) (vs 25% for the distant Indo-European pool) · deep-family-core hit-rate 90%. The audit surfaced 30+ structural revelations, cases where the framework didn't just confirm a known cognate but revealed a hidden connection: metathesis cognates (لِسان ↔ ns, with Coptic ⲗⲁⲥ restoring the ل · أَنف ↔ fnḏ), dual-face L3 swaps (رود/روض · واسخ/واسع), and Egyptian polysemy as proof of shared seed (snt = tooth + sister + second on one nucleus · mwt = mother + die · ḥtp = rest + offering). The framework wasn't designed with Egyptian in mind; it just works, which is exactly what happens when a grammar documents something genuinely Afro-Asiatic rather than Arabic-specific.
العَرَبيّةُ والمِصريّةُ القَديمةُ أُسرةٌ قَريبة: كِلتاهُما أَفروأَسيويّة، كِلتاهُما تَتَشارَكانِ سَلَفًا أَقدَمَ مِن سِجِلّاتِ المِسماريّة. أَخَذنا 200 زَوجَ كَلِماتٍ تَشمَل طَيف المُفرَدات كُلَّه (الضَّمائر، أَجزاء الجَسَد، القَرابة، أَفعال الحَرَكة، أَفعال الفِعل، الإدراك، الصِّفات، الطَّبيعة، الزَّمَن، المُقَدَّس) وَأَدخَلناها كُلَّها في الإطار. 199 مِن 200 تُقرَأ بِتَماسُك · مُعَدَّلُ الإصابةِ في أَعلى ثَلاثة أَصناف 55% (كان 52%) (مُقابِل 25% في الحَوضِ الهندوأوربيّ البَعيد) · مُعَدَّلُ القَلبِ العَميقِ المُشتَرَك 90%. أَطلَعَ التَّدقيقُ 30+ كَشفًا بِنيَويًّا، حالاتٍ لم يَكتَفِ فيها الإطارُ بِتَأكيدِ جِنَاسٍ مَعروف، بَل كَشَفَ صِلةً مَخفيّة: جِنَاسات بِقَلب المَواضِع (لِسان ↔ ns، القِبطيّةُ ⲗⲁⲥ تَستَعيدُ اللام · أَنف ↔ fnḏ)، إبدالات وَجهَين عَلى L3 (رود/روض · واسخ/واسع)، وَتَعَدُّد دَلالات مِصريّة كَدَليل عَلى البَذرة المُشتَرَكة (snt = سِنّ + أُخت + ثانٍ عَلى نَواةٍ واحِدة · mwt = أُمّ + مات · ḥtp = راحة + قُربان). الإطارُ لم يُصاغ والمِصريّةُ في الذِّهن؛ وَمَع ذلكَ يَعمَل.
The next sections walk through the methodology, the findings, and the cross-linguistic results in technical detail. الأَقسامُ التالية تَمُرّ بِالمَنهَجيّةِ والنَّتائجِ وثِمارِ ما بَينَ اللُّغاتِ بِتَفصيلٍ تِقنيّ.
How the framework works · letter → nucleus → root → word
كَيفَ تَعمَلُ المَنظومة · حَرف ← نَواة ← جَذر ← كَلِمة
An Arabic word is built like a small machine. Each letter is a part with a job. The first two letters click together into a seed-meaning. The third letter says how the seed acts: does it carry, hold, release, block, channel? The full word is one specific instance of that composed motion. This section shows the four layers of the stack, the five-step reading anyone can follow, and the dual-face rule that makes the whole system click.
الكَلِمةُ العَرَبيّةُ مَبنيّةٌ كَآلةٍ صَغيرة. كُلُّ حَرفٍ قِطعةٌ بِوَظيفة. الحَرفان الأَوّلان يَلتَقيان في بَذرة مَعنى. الحَرفُ الثّالِث يَقول كَيفَ تَعمَلُ البَذرة، هَل تَحمِل، تُمسِك، تُطلِق، تَحجُب، تُوَجِّه؟ والكَلِمةُ كاملةً تَجَلٍّ مَخصوصٌ لِتِلكَ الحَركة المُرَكَّبة. هذا القِسمُ يُري الطَّبَقات الأَربعَ، وَخُطُواتِ القِراءة الخَمسَ، وَقاعِدةَ الوَجهَين التي تُحرِّك المَنظومةَ كُلَّها.
The Juthoor stackطبقاتُ مشروع جُذُور (every layer is clickable)(كلّ طبقة قابلة للنقر)
Empirical corpus underneath: 2,300 unique roots in the canonical lexicon · 1,666 Quranic verses · the classical and modern scholarly sources frozen in Data raw/.
المُدَوَّنة التَّجريبيّة تَحتها: 2,300 جذرٍ فريد في المُعجَم المَرجِع · 1,666 آيةً قرآنيّة · المصادر الكلاسيكيّة والحديثة المُجَمَّدة في Data raw/.
The five-step reading protocolبروتوكول القراءة من خمس خطوات
Name the lettersسَمِّ الحروف
Form the nucleusكَوِّن النواة
Add remaining lettersأَضِف الحروف الباقية
State the literal meaningصُغ المعنى الحَرفيّ
Connect to usageصِلْها بالاستعمال
The universal dual-face structureقاعدةُ الوَجهَين العامّة
Empirical testing across all 453 binary nuclei in the canonical lexicon revealed a structural property that earlier scholarship had only suspected for a handful of letters: every Arabic letter carries two semantic faces of the same physical articulation. The trilateral family selects which face is active. This is one of the study's principal new findings. Per-letter stress test with 4–6 binary nuclei split between the two faces, and Quranic verse anchors, is in dual-face-stress-test.md.
كَشَفَ الاستقراءُ على الأربعمائة والثلاث والخمسين نواةً ثنائيّةً في المُعجَم خاصّيّةً لم يَستَكشِفْها مَن سَبَق إلّا في حروفٍ مَعدودة: كلّ حرفٍ عربيٍّ يَحمل وَجهَين دلاليَّين لِمَخرَجٍ نُطقيٍّ واحد، والحرف الثالث في الجذر هو الذي يُحدِّد أيّ الوَجهَين يَعمل. هذه إحدى النتائج الجديدة الرئيسة لِلدراسة. واختبارُ ضَغطٍ حَرفًا حَرفًا، بِأَربعِ إلى سِتِّ نَوًى ثُنائيّةٍ مَوزَّعةٍ على الوَجهَين مع مَراسٍ قُرآنيّة، في dual-face-stress-test-ar.md.
ن
Primary «انبِعاث رَنينيّ», outward resonant emission (نج, نف, نو).
Variant «رَنين مَحبوس», held cavity resonance (ثن, تن, طن). Same nasal articulation, two phases.
الوجه الأوّل «انبِعاث رَنينيّ»، رَنينٌ يَخرج إلى الخارج (نج، نف، نو).
الوجه الآخر «رَنين مَحبوس»، رَنينٌ مَحبوسٌ في تجويف (ثن، تن، طن). نُطقٌ أنفيٌّ واحد، وَجهانِ في مَرحَلتَين.
ج
Primary «تَجَمُّع في حَيِّز», gathering in a space.
Variant «بُروز من حَيِّز», surfacing out of a space (جَهْرًا, الْجِنّ). Same mid-palate burst, two semantic directions.
الوجه الأوّل «تَجَمُّع في حَيِّز»، اجتماعٌ داخل فَضاء.
الوجه الآخر «بُروز من حَيِّز»، خُروجٌ من فَضاء (جَهْرًا، الْجِنّ). انفجارٌ وَسَطيّ واحد، اتّجاهانِ دلاليّان.
ه
Primary «همس + تَنَفُّس», soft passing presence.
Variant «نَفَسٌ يَحمِل ويَتَلاشى», breath that carries off, dissipating. Same pure exhale, two roles.
الوجه الأوّل «همس + تَنَفُّس»، حُضورٌ ناعمٌ عابر.
الوجه الآخر «نَفَسٌ يَحمِل ويَتَلاشى»، نَفَسٌ يَحمل ثُمَّ يَنطَفئ. زَفيرٌ خالصٌ واحد، دَورانِ.
ب
Primary «اتّصال + تَمَسُّك», attachment that holds and reveals (gateway, opening to show).
Variant «انطِباق + إغلاق», sealed enclosure. Same lip closure, two faces.
الوجه الأوّل «اتّصال + تَمَسُّك»، التِصاقٌ يُمسِك ويُبدي (كَالباب يَجمع ويُظهر ما خَلفه).
الوجه الآخر «انطِباق + إغلاق»، إحكامُ الإغلاق. انطباقُ الشَّفَتَين نَفسُهُ، وَجهانِ.
The eleven native composition modes (+ LOANWORD label)الأَبوابُ الأَحَدَ عَشَر الأَصيلة (مع مَدخَل الدَّخيل)
The bottom-up path from letter to binary to trilateral is grounded by the study's second principal finding. Every Arabic trilateral root in the lexicon is interpretable as a single operative relation:
هذه النتيجةُ الثانية تُكمِل المسارَ الصاعد من الحرف إلى النَّواة إلى الجذر. كلُّ جذرٍ ثلاثيٍّ عربيٍّ في المُعجَم يَنحَلّ، من غير تَكَلُّف، إلى علاقة عَمَلٍ واحدة بين النَّواة الثنائيّة والحرف الثالث:
…where this "operation" takes one of eleven native composition modes (with a twelfth label, LOANWORD, reserved for the 1-in-2,285 non-native root), finite and closed. 2,285 of 2,288 trilaterals graded (99.87%), all of them (100%) fall into a coherent mode without forcing. Caveat (kept close to the claim): every verdict comes from a single rater, and the model is descriptive rather than generative at this stage. All 2,285 records now carry a complete letter-by-letter binary reading, the final 302 weak-letter and defective-root nuclei (hollow / hamzated / و-ي roots) were completed from the fixed charges, anchored to Jabal's axial meanings. The focused Qur'anic loanword audit (27 worked cases from al-Suyūṭī's al-Itqān and Jeffery's catalog) finds that all 27 (100%) resolve as native, reverse-cognate, or convergent, none is a passive borrowing into Arabic. See lv2-operative-grammar.md for the full methodology and the interactive dashboard.
…و«العَمَل» هنا يَجري في أَحَدَ عَشَر بابًا أَصيلًا مَحدودةً مُغلَقة، مع مَدخَلٍ ثانٍ عشرَ، الدَّخيل، لِلجَذر غير الأَصيل (حالةٌ واحدةٌ من 2,285)، تَستوعِب الجذور كلَّها. اسْتُقرِئَ 2,285 جذرًا من أصل 2,288 (99.87%)، فاطَّرَدَت كلُّها (100%) على بابٍ مُتَّسقٍ من غير تَكَلُّف. تَنبيهٌ مَوصولٌ بِالدَّعوى: الحُكمُ في كُلّ جَذرٍ مِن مُقَيِّمٍ واحد، والنَّموذجُ وَصفيٌّ في هذه المَرحَلة لا تَوليديّ. وكُلُّ السِّجِلّات الـ 2,285 تَحمِلُ الآنَ قِراءةً حَرفيّةً ثُنائيّةً كامِلة، أُكمِلَتِ النَّوى الـ 302 الأَخيرةُ (الجُذورُ الجَوفاءُ والمَهموزةُ وذَواتُ الواوِ والياء) مِنَ الشَّحَناتِ الثابِتة، مُسنَدةً إلى مَحاوِرِ جَبَل المَعنَويّة. وَتَجِدُ المُراجَعةُ المُخَصَّصة لِلدَّخيل في القُرآن (27 حالةً مَدروسةً مِن «الإتقان» لِلسيوطيّ وكاتالوج جيفري) أَنّ الـ 27 كُلَّها (100%) تَنحَلّ إلى أَصيلٍ، أَو استِعارةٍ عَكسيّة، أَو تَلاقٍ مُستَقِلّ، لا واحِدةَ مِنها استِعارةٌ سَلبيّةٌ دَخَلَت العَرَبيّة. انظر lv2-operative-grammar.md لِلمَنهج الكامل، واللَّوحة التَّفاعُليّة.
The structural insightالمُلاحَظة الأصليّة
The binary nucleus is the agent; the third letter is the material the nucleus acts upon. Under this reading, قصر reads cleanly as "قص-cutting-precision BLOCKS the flow (ر)", a single coherent operation, like every other native trilateral in the corpus.
النَّواةُ الثنائيّةُ هي الفاعل، والحرف الثالث هو المادّة التي تَعمل فيها النَّواة. على هذه القراءة، يَنحَلّ قصر سَلِسًا: «قص القَطع الحاسم يَحجُب الجريانَ (ر)»، علاقةُ عَمَلٍ واحدةٌ مُتَّسقة، كَكلّ جذرٍ ثلاثيٍّ أصيلٍ في المُدَوَّنة.
The eleven native modes (plus the LOANWORD label), grouped by stanceالأَحَدَ عَشَرَ بابًا الأَصيلة (مع مَدخَل الدَّخيل)، مُجَمَّعةً بالوضع
| Stanceالوضع | Modeالنمط | Meaningالمعنى | Exampleمثال | % of corpus% من المُدَوَّنة |
|---|---|---|---|---|
| POSITIVE 55.2%إيجاب 55.2% | CARRYالحَمْل | binary carries L3-material forwardالنَّواةُ تَحمل مادّة الحرف الثالث وتُسَيِّرها | ورد, و-bind carries د-fixity → arrivingورد: و-الرَّبط تَحمل د-الثَّبات ← الوُصول | 6.4% |
| HOLDالإمْساك | binary contains/encloses L3النَّواةُ تَحوي الحرفَ الثالث وتُمسكه | بلد, بل-wet holds د-fixity → groundبلد: بل-الرُّطوبة تُمسك د-الثَّبات ← الأرضُ الثابتة | 16.3% | |
| RELEASEالإطْلاق | binary lets L3-material burst outالنَّواةُ تُطلق مادّة الحرف الثالث وتُخرجها | فتح, فت-loose releases ح-warmth → openingفتح: فت-الإرخاء تُطلق ح-الحرارة ← الانفتاح | 9.1% | |
| PROJECTالإبْراز | binary extends L3 outward as featureالنَّواةُ تُبرز الحرفَ الثالث صِفةً ظاهرة | حدد, ح-edge projects د-fixity → boundaryحدد: ح-الحَرف تُبرز د-الثَّبات ← الحَدّ | 11.7% | |
| INTENSIFYالتَّضْعيف | doubled or amplified L3تَضعيفُ الحرف الثالث وتَكثيفُه | جمد, ج-gather amplifies د-fixity → freezingجمد: ج-التَّجَمُّع تُضَعِّف د-الثَّبات ← التَّجَمُّد | 11.7% | |
| NEGATIVE 11.5%سَلْب 11.5% | BLOCKالحَجْب | binary stops/seals/walls off L3النَّواةُ تَحجب الحرفَ الثالث وتَسُدُّه | سدد, س-flow blocked → sealing, stoppingسدد: س-الجَريان مَحجوبٌ ← السَّدّ والوَقف | 5.8% |
| DRAINالاسْتِنزاف | binary gradually depletes L3النَّواةُ تَستنزف الحرفَ الثالث تَدريجًا | فقد, فق-void drains د-fixity → losingفقد: فق-الفَراغ تَستنزف د-الثَّبات ← الفَقد | 5.7% | |
| TRANSFORM 33.3%تَحَوُّل 33.3% | CHANNELالتَّوجيه | binary directs/shapes L3's pathالنَّواةُ تُوَجِّه الحرفَ الثالث وتَسوقُه | جرى, جر-pull channels ى-flow → runningجرى: جر-الجَذب تُوَجِّه ى-الجَريان ← الجَري | 5.3% |
| OPERATEالإعْمال | binary modifies L3 via squeeze/fold/cutالنَّواةُ تَعمل في الحرف الثالث بِالضَّغط أو الطَّيّ أو القَطع | حسم, حس-feel operates on م-mass → cuttingحسم: حس-اللَّمس تَعمل في م-الكُتلة ← القَطع | 24.4% | |
| MIXالمَزْج | blends the binary with L3النَّواةُ تَمتزج بالحرف الثالث وتَختلط به | روب, رو-going mixes ب-attach → curdled milkروب: رو-المَسير تَمتزج بـ ب-الالتِصاق ← الحَليب المُتَخَثِّر | 0.6% | |
| REVERTالقَلْب | circles back / oscillates L3النَّواةُ تَردّ الحرفَ الثالث وتُعيدُه | ردد, ر-flow reverts د-fixity → returningردد: ر-الجَريان يَردّ د-الثَّبات ← العَودة | 2.9% | |
| EXCEPTIONاستِثناء | LOANWORDالدَّخيل | non-native compositionتركيبٌ غير أصيل، دَخيلٌ على العربيّة | 1 / 2,285 in current dataset1 من 2,285 في المُدَوَّنة الحاليّة | 0.0% |
Predictive tests, all confirmedاختباراتٌ تَنبُّؤيّة، اطَّرَدَت كلُّها
A descriptive grammar can always be made to fit after the fact. What separates a real rule from after-the-fact fitting is whether it makes prediction in advance that the data then confirms. If the eleven native composition modes are real, then specific root shapes and specific letter-charge classes should cluster in specific modes, and they do.
النَّحوُ الوَصفيّ يُمكن أن يَتَكَيَّف مع البَيانات بَعد وُقوعها. الفَيصلُ بين القاعدة الحَقيقيّة والتَّكَيُّف اللاحق هو أن تُقَدِّم القاعدةُ تَنبُّؤًا سابقًا تُؤَكِّده البَيانات. إن كانت الأبواب الاثنا عشر صحيحةً، فإنّ أنماطًا مَخصوصةً من الجذور وحُروفًا مَخصوصةً من الشَّحَنات يَنبغي أن تَتَجَمَّع في أبوابٍ مَخصوصة. وهذا ما حَدَث:
| Testالاختبار | Predicted patternالتَّنبُّؤ | Observedالمُلاحَظ |
|---|---|---|
| Doubled-final roots (XYY: بدد · ردد · جدد)الجُذور مُضَعَّفة الآخر (XYY: بدد · ردد · جدد) | INTENSIFY + OPERATE dominateيَغلب التَّضعيف والإعمال | 66.9% of 405 roots ✓66.9% من 405 جذرًا ✓ |
| Redoubled XY-XY roots (دردر · جمجم)الجُذور المُكَرَّرة XY-XY (دردر · جمجم) | OPERATE + INTENSIFY dominateيَغلب الإعمال والتَّضعيف | 66.9% of 251 roots ✓66.9% من 251 جذرًا ✓ |
| Letters with flow charge (ر · ل · ن · ع)الحروف ذات شَحنة الجَريان (ر · ل · ن · ع) | Skew positive (CARRY · CHANNEL · PROJECT · RELEASE)تَميل إلى الإيجاب (الحَمل · التَّوجيه · الإبراز · الإطلاق) | Confirmed ✓مُؤَكَّد ✓ |
| Letters with mass charge (د · م · ق · ك · ص)الحروف ذات شَحنة الكُتلة (د · م · ق · ك · ص) | OPERATE + HOLD dominateيَغلب الإعمال والإمساك | Confirmed ✓مُؤَكَّد ✓ |
Scope of the result: why 453 / 505, not 784?نطاق النتيجة: لماذا 453/505 لا 784؟ honest framingعرضٌ صريح
A reader seeing "100% native fit" and "453 binary nuclei" will reasonably ask: what about the other pairs? With 28 letters, there are 28² = 784 mathematical possibilities for an L1·L2 binary. After folding hamza variants (أ/إ/آ/ء → ا) and alif-maqsura (ى → ي) onto the canonical alphabet, 505 unique binaries appear in at least one trilateral root in the lexicon (507 raw forms before fold; 453 are catalogued as standalone nuclei). Of the remaining 279 unattested pairs, the partition is honest and adds up:
القارئ الذي يَرى «100% انطباقٌ تامّ» و«453 نواةً ثنائيّة» سيَسأل بِحَقّ: ماذا عن الأزواج الباقية؟ بِالحُروف الثمانية والعشرين، هناك 28² = 784 إمكانيّةً حسابيّة لِزوج L1·L2. بِطَيِّ الهَمَزات (أ/إ/آ/ء ← ا) والألف المَقصورة (ى ← ي) إلى حُروف المُعجَم القَياسيّة، 505 نواةً فريدةً تَظهَر في جذرٍ ثلاثيّ في المُعجَم (507 صُوَر خامّ قَبل الطَّيّ، و453 منها مُدَوَّنةٌ في ديوان النَّوى المُستَقِلّ). أمّا الأَزواج الـ279 غير المُسَجَّلة، فالتَّقسيمُ صَريحٌ وحِسابُهُ يَنضَبط:
| Filterالمُصَفّاة | Pairs removedأزواجٌ مَحذوفة | Linguistic reasonالسبب اللغويّ |
|---|---|---|
| alif-initialمَبدوءٌ بالألف (ا as L1, after hamza-fold)(ا في الموضع الأوّل بَعد طَيّ الهَمَزات) | 7 | The 7 ا-initial slots that even hamza variants didn't fill: اا · اض · اط · اظ · اع · اغ · اقالسَّبع الباقيات التي لم تَملأها أيّ صُورة هَمزيّة: اا · اض · اط · اظ · اع · اغ · اق |
| identical XXحرفان مُتطابقان (e.g. بب, دد, …)(مِثل بب، دد، …) | 25 | OCP (Obligatory Contour Principle), repeated consonants blocked (only هه and وو survive)قاعدةُ منع التَّماثُل في الصوامت في بداية الجذر (فقط هه و وو نَجتا) |
| same-articulator classحرفانِ من مَخرَجٍ واحد | 107 | Soft OCP, tongue-tip-twice (e.g. تد), lips-twice (e.g. بم) and similar adjacencies dispreferredقاعدةُ منع التَّماثُل المُخَفَّفة: طَرفُ اللسان مَرَّتَين (مثل تد)، أو الشَّفَتانِ مَرَّتَين (مثل بم)، وما أشبهها مَكروهٌ في الجَوار |
| Genuine lexical gapsفَجواتٌ مُعجميّةٌ حَقيقيّة | 140 | Phonologically allowed by Arabic but unused: the language could form them, but doesn'tيَسمح بها نظامُ أصوات العربيّة، لكنّها غيرُ مُستَعمَلة؛ كانت اللغة قادرةً على تَكوينها فلم تَفعَل |
Math check: 505 attested + 139 phonotactically blocked + 140 lexical gaps = 784 ✓. The full per-L1 listing is auto-generated in layer-2-coverage-gap.md.
تحقّق حسابيّ: 505 نواةً مُسَجَّلة + 139 مَحجوبًا صوتيًّا + 140 فَجوةً مُعجميّة = 784 ✓. التَّفصيلُ الكامل في layer-2-coverage-gap.md المُوَلَّد آليًّا.
Phonotactically blockedمَحجوبٌ صوتيًّا-تركيبيًّا
139 pairs (50%) of the unattested set are blocked by known Arabic phonological constraints: alif as a vowel, OCP, articulator-class. These are not gaps; Arabic structurally cannot have them.
139 زوجًا (50%) من الأزواج غير المُستعمَلة محجوبةٌ بِقيودٍ صوتيّةٍ معروفةٍ في العربيّة: الألف كَصائت، مبدأ OCP، صنف المُخرَج. هذه ليست فجوات؛ فالعربيّةُ بِنيويًّا لا تَستطيع امتلاكها.
True lexical gapsفجواتٌ مُعجميّةٌ حَقيقيّة
Only 140 pairs (18% of all 784, or 50% of the 279 unattested) are pairs the language could have used but doesn't: the natural held-out test set for whether the operative model can become generative.
140 زوجًا فقط (18% من 784، أو 50% من الـ279 غير المُسَجَّلة) هي ما كان بِوُسع اللغة استعمالُها فلم تَستعمله؛ وهي مَجموعةُ الاختبار الطبيعيّة المُؤجَّلة لِقياس ما إذا كان نموذجُ التركيب يُمكن أن يَصير تَوليديًّا.
The honest claimالدَّعوى الصريحة
Every trilateral that exists in Arabic gets a coherent operative reading. We did not claim every theoretical XYZ would, and we name where the model's predictive reach is currently untested.
كلّ جذرٍ ثلاثيٍّ موجودٍ في العربيّة يَنحَلّ إلى قراءة عَمَلٍ مُتَّسقة. لم نَدَّعِ أنّ كلّ XYZ نظريٍّ سيَفعل، ونُسَمّي بِصراحةٍ المَوضعَ الذي لم يُختَبَر فيه مَدى التنبّؤ بَعدُ.
The reference tables
الجَداوِلُ المَرجِعيّة
Two tables do most of the work in this study. The first lists what each of the 28 Arabic letters *means*, its physical gesture and its semantic flavour. The second lists the 18 most active two-letter seeds, the ones that build the largest families of roots. Every line is traceable to a source.
جَدولانِ يَحمِلانِ مُعظَمَ الثِّقَل في هذه الدِّراسة. الأَوّلُ يَسرُد ما *يَعنيه* كُلُّ حَرفٍ مِنَ الـ 28، حَركَتُه الجَسَديّةُ وذَوقُه الدَّلاليّ. والثّاني يَسرُد الـ 18 بَذرَةَ ثُنائيّةٍ الأَكثَرَ نَشاطًا، تِلكَ التي تَبني أَكبَر العائلات الجِذريّة. كُلُّ سَطرٍ يَعودُ إلى مَصدَر.
The 28-letter unified charge tableجدولُ الحروف الثمانية والعشرين المُوَحَّد
One unified charge per letter, with phonetic note and English gloss. See consensus-letter-charges.md for the full file with variants section.
شَحنةٌ مُوَحَّدةٌ لِكلّ حرف، مع وَصفٍ نُطقيٍّ ومُقابلٍ إنجليزيّ. انظر consensus-letter-charges.md لِلمَلفّ الكامل مع قِسم الفُروق.
| حرف | Unified chargeالشَّحنة المُوَحَّدة | Phonetic noteإشارة صوتيّة | English glossالمُقابل الإنجليزيّ |
|---|---|---|---|
| ء | تَأكيد + قَطع | sharp glottal onset, breath stopped at the throatوَقفٌ حَنجَريٌّ حادّ، النَّفَس مَوقوفٌ عند الحَلق | sharp affirmation, beginning |
| ا | امتداد صائت | breath standing open, prolongedنَفَسٌ مَفتوحٌ مَمدود | extension, sustained presence |
| ب | اتّصال + تَمَسُّك | lips press and release, closing-then-opening sealالشَّفَتانِ تَنطَبقانِ ثُمَّ تَنفَتِحان، إغلاقٌ يَتبَعُه فَتح | attachment, holding, gateway |
| ت | امتداد لطيف + تَمام | tongue tip touches upper teeth, light percussionطَرفُ اللسان يَلمُس الأسنانَ العُليا، قَرعٌ خَفيف | gentle extension to completion |
| ث | تَناثُر + تَفَتُّت | tongue between teeth, fine breathy spreadاللسانُ بين الأسنانِ، انتشارٌ نَفَسيٌّ دَقيق | scattering, small-grained spread |
| ج | تَجَمُّع في حَيِّز | mid-palate stop with an emerging burstوَقفةٌ وَسَطُ الحَنَكِ مع بَزْغ | gathering in a space, surfacing |
| ح | حياةٌ حارّة + احتواء | deep throat friction, warm breath enclosedاحتِكاكٌ عَميقٌ في الحَلق، نَفَسٌ دافئٌ مَحبوس | living warmth that contains |
| خ | تَخَلخُل + اختِراق | scratchy back-of-throat frictionاحتِكاكٌ خَلفَ الحَلق، خَشِنٌ جافّ | rarefying, piercing through |
| د | ضَبط + ثَبات | tongue behind teeth, firm closed nudgeاللسانُ خَلفَ الأسنان، دَفعةٌ مُغلَقةٌ حازِمة | fixity, grounding, settled push |
| ذ | نَفاذ + حِدَّة | tongue between teeth with voiceاللسانُ بين الأسنانِ بِصَوتٍ مَجهور | piercing from inside, fine bringing-out |
| ر | تَكرار + جَريان | tongue tip rolls against alveolar ridgeطَرفُ اللسان يَرتَجِف على غارِ الحَنَك | repetition, running, flow |
| ز | اندفاع + اهتزاز | sharp voiced sibilant from the frontصَفيرٌ حادٌّ مَجهور من المُقَدَّم | thrust with vibration, sharp penetration |
| س | امتداد + سَيَلان | breathy sibilant gliding forwardصَفيرٌ مَهموسٌ يَنزَلِق إلى الأمام | extending flow, fine streaming |
| ش | انتشار + تَفَرُّق | wide breathy spread from the front of the mouthانتشارٌ نَفَسيٌّ واسعٌ من مُقَدَّم الفم | branching, scattering outward |
| ص | صَلابة + إطباق | emphatic sibilant from a tight palateصَفيرٌ مُطبَقٌ من حَنَكٍ مَشدود | hardness, sealed strength |
| ض | ضَمّ + ثِقَل | emphatic voiced lateral, tongue presses heavyجانبيٌّ مَجهورٌ مُطبَق، اللسانُ يَضغَط بِثِقَل | drawing-together with weight |
| ط | انبساط + انتشار ثَقيل | emphatic dental, heavy spreading touchأسنانيٌّ مُطبَق، لَمسةٌ ثَقيلةٌ مُنتَشِرة | broad heavy spreading |
| ظ | بُروز + حِدّة | emphatic interdentalبين-أسنانيٌّ مُطبَق | pronounced surfacing, edged prominence |
| ع | قَبضٌ حَلقيٌّ + شِدّة | deep guttural pharyngeal gripقَبضةٌ حَلقيّةٌ عَميقة | depth-grip, intense from the throat |
| غ | غَور يَستر | back-of-throat fricativeاحتِكاكٌ خَلفَ الحَلق | concealing depth, covering |
| ف | تَفريق + نَفاذ | breath escapes between lip and upper teethالنَّفَسُ يَخرج بين الشَّفة السُّفلى والأسنان العُليا | parting through, splitting open |
| ق | قَطع + إحكام | back-of-palate stop, firm releaseوَقفةٌ خَلفَ الحَنَك، إفراجٌ حازم | cutting precision, firm settling |
| ك | كَتم + قَطع | unvoiced back-of-palate stopوَقفةٌ مَهموسةٌ خَلفَ الحَنَك | pressed closure, sealed cut |
| ل | تَعَلُّق + امتِداد | tongue against alveolar ridge, voiced glideاللسانُ على غارِ الحَنَك، انزِلاقٌ مَجهور | attachment that extends, a bridge |
| م | تَجمُّع + تَلاصُق | lips closing, breath gatheredالشَّفَتانِ تَنغَلِقانِ، النَّفَس مَجموع | gathering, sealing into a mass |
| ن | رَنين + انبِعاث | nasal resonance from insideرَنينٌ أنفيٌّ من الباطن | inner resonance emitted outward |
| ه | همس + تَنَفُّس | soft exhale from the throatزَفيرٌ ناعمٌ من الحَلق | breath, soft passing |
| و | وَصل + ربط | rounded lips, sustained connectorالشَّفَتانِ مُدَوَّرَتان، وَصلٌ مَمدود | binding, joining, sustained link |
| ي | امتداد + لِين + سَريان | front of palate, voiced glideمُقَدَّمُ الحَنَك، انزِلاقٌ مَجهور | gentle directed extension |
The 18-nucleus working setالمجموعة العاملة، ثماني عشرة نواة
A curated subset of the 453 binary nuclei, the highest-frequency, Quran-anchored seeds. The full 453 catalog with charge-only and TC-anchored dossiers is in 03-scholar-extracts/jabal-nuclei-*.md.
مُختارَةٌ من النوى الثنائيّة (453 نواة)، أعلاها تَردُّدًا وأقواها رُسوخًا في القرآن. الديوانُ الكامل لِلنوى، مع المَلفّات المَشحونة فحسب والمَلفّات الراسخة في تفسير قرآن، مَوجودٌ في 03-scholar-extracts/jabal-nuclei-*.md.
| Nucleusالنواة | Meaningالمعنى | Examplesأمثلة |
|---|---|---|
| ال | extending attachment, intimate bondتَعَلُّقٌ مُمتدّ، صِلةٌ حَميمة | أَلِفَ، إِلْف، آلاء |
| بر | manifest extension, surfacing-and-runningامتدادٌ ظاهر، بُروزٌ وجَريان | بَرَّ، بَرَزَ، بَرَأَ |
| بد | manifest fixing, surface-staysثَباتٌ ظاهر، ظُهورٌ يَستَقِرّ | بَدَأ، بَدَا، بَدَّلَ |
| حم | living containment, warm enclosureاحتواءٌ حَيّ، إحاطةٌ دافِئة | حَمَى، حَمَلَ، حَمِدَ، رَحِم |
| حق | living precision, contained truthإحكامٌ حَيّ، حَقيقةٌ مُحاطة | حَقّ، حَقَّقَ، حَقيقة |
| رب | repeating attachment, holding-and-multiplyingتَعَلُّقٌ مُتَكَرِّر، إمساكٌ وتَكثير | رَبّى، رَبا، تَربية |
| رح | repeating warmth, recurring containmentدِفءٌ مُتَكَرِّر، احتواءٌ مُتَجَدِّد | رَحِم، رَحْمَة، راحة |
| سل | flowing attachment, fine slidingتَعَلُّقٌ جارٍ، انزِلاقٌ لَطيف | سَلَّمَ، سَلَكَ، سَلِمَ |
| سم | extending-toward-completion, liftingامتدادٌ نحو التَّمام، ارتِفاع | سَمَا، اسم، سَموّ |
| عل | depth-grip extendingقَبضٌ عَميقٌ يَمتدّ | عَلِمَ، عَلَا، عِلم، عالَم |
| فر | parting-then-runningتَفريقٌ ثُمّ جَريان | فَرَّ، فَرَقَ، فَرَدَ |
| فط | parting-then-spreadingتَفريقٌ ثُمّ انتِشار | فَطَرَ، فِطرة |
| قر | precision repeating, firm settlingإحكامٌ مُتَكَرِّر، اسْتِقرارٌ ثابِت | قَرَأ، قَرَّ، قَرارَ |
| كل | sealed extension, pressed-attachmentامتدادٌ مَختوم، تَعَلُّقٌ مَضغوط | كَلَّ، كُلّ، كَلِمة |
| ملك | gathering-and-sealing-at-a-cutجَمعٌ وإحكامٌ عِند القَطع | مَلَك، مُلْك، مَليك |
| نج | inner resonance gatheringرَنينٌ داخليٌّ يَجتمع | نَجا، نَجم |
| هد | breath-fixingنَفَسٌ يَستَقِرّ | هَدى، هَدَأ |
| وص | binding-with-emphatic-strengthرَبطٌ بِشِدّةٍ مُطبَقة | وَصَلَ، وَصَى، وَصْف |
Words that echo across languages
كَلِماتٌ يَتَرَدَّدُ صَداها بين اللُّغات
Try saying كَلام (kalām) and "claim" out loud. Or قَول (qawl) and "call." Or جَنّ (jinn) and "genie." The match isn't accidental: the same human mouth, faced with the same human meaning, shapes the same sound. This section catalogues that echo, and the discipline we use to tell a real one from a coincidence.
قُل كَلام و claim بِصَوتٍ عالٍ. أَو قَول و call. أَو جِنّ و genie. التَّوافُقُ ليسَ صُدفة، الفَمُ البَشَريّ نَفسُه، أَمامَ المَعنى البَشَريّ نَفسِه، يُشَكِّلُ الصَّوتَ نَفسَه. هذا القِسمُ يُكَتلِجُ ذلك الصَّدى، والمَنهَجُ الذي نُمَيِّزُ بِه الحَقيقيَّ مِنَ المُصادَفة.
President of the Libyan Arabic Language Academy, member of the Cairo Arabic Language Academy, PhD in philosophy (Durham, 1971). Author of رِحلة الكلمات (Journey of Words, 1986 / 1998), the modern Arabic-language reference for comparative work between Arabic and other language families. Khshim's nine sound-substitution laws govern the consonantal correspondences that the rubric below depends on.
رئيس مَجمع اللغة العربيّة اللّيبيّ، وعضو مَجمع اللغة العربيّة بالقاهرة، دكتوراه في الفلسفة (دَرَم، 1971). صاحب «رِحلة الكلمات» (1986 / 1998)، المرجع العربيّ الحديث في العمل المُقارِن بين العربيّة وسائر العائلات اللغويّة. قوانينُ الإبدال الصوتيّ التِّسعة عند خشيم تَحكُم التَّقابُلات الصامتيّة التي يَعتمد عليها المعيار التالي.
The four-bar verification rubricضوابطُ التحقّق الأربعة
A pair earns Tier-A status only if it clears all four bars: consonant skeleton match (via Khshim's sound-substitution laws) · nucleus identity (the binary semantic seed survives the crossing) · modern reader-recognition · dual-family confirmation (Semitic and Indo-European traces). See tafsir-coran-tier-a-cognates.md for the full Tier-B ledger and the anti-patterns.
The same four-bar rubric, applied in reverse, asks the harder question: do the centuries-old "loanword" claims about Qur'anic words actually survive scrutiny? We worked all 27 cases listed in al-Suyūṭī's al-Itqān and Arthur Jeffery's catalog through the framework. The result: all 27 (100%) resolve as native Arabic compositions, reverse-borrowings from Arabic, or convergent emergence: none is a passive borrowing into Arabic. The two cases that long resisted both turned out to be morphological misreadings: مَجوس is a trilateral م-ج-س on وزن فَعول (the augment-و is not a root letter), and زنجبيل is a native compound زَنّ + جُبَيل · "the small molded knob that emits a sharp zing", exactly the pattern of بَعلَبَك and حَضرَموت. What looked for centuries like proof of foreign vocabulary in the Qur'an dissolves when each word is read letter-by-letter under a disciplined native grammar. Full evidence and per-word readings: quranic-loanword-audit.md.
تُطَبَّقُ الضَّوابطُ الأَربعةُ نَفسُها في الاتّجاه المُعاكِس، وَتَطرَح السُّؤالَ الأَصعَب: هَل تَنجو دَعاوى «الدَّخيل» القَرنيّةُ في الكَلِمات القُرآنيّة مِن الفَحصِ فِعلًا؟ دَرَسنا الـ 27 حالةً كُلَّها كَما أَوْرَدَتها «الإتقان» لِلسيوطيّ وكاتالوج آرثر جيفري عَبر الإطار. النَّتيجة: السَّبعةُ والعِشرونَ كُلُّها (100%) تَنحَلّ إلى تَركيباتٍ عَرَبيّةٍ أَصيلة، أَو استِعاراتٍ عَكسيّةٍ مِنَ العَرَبيّة، أَو تَلاقٍ مُستَقِلّ، لا واحِدةَ مِنها استِعارةٌ سَلبيّةٌ دَخَلَت العَرَبيّة. الحالَتانِ اللَّتانِ قاوَمَتا طَويلًا تَبَيَّنَ أَنّ كِلتَيهِما خَطأُ قِراءةٍ صَرفيّة: مَجوس ثُلاثيٌّ م-ج-س عَلى وَزن فَعول (الواو ليسَت حَرفَ جَذر)، وَزنجَبيل مُرَكَّبٌ عَرَبيٌّ أَصيلٌ مِن زَنّ + جُبَيل · «النُّتوءُ الصَّغيرُ المَصبوبُ يَنفُذ مِنه وَخزٌ حادّ»، عَلى عَين نَمَط بَعلَبَك وحَضرَموت. ما بَدا قُرونًا دَليلًا عَلى مُفرَداتٍ أَجنبيّةٍ في القُرآنِ يَتَلاشى حِين تُقرَأ كُلُّ كَلِمةٍ حَرفًا حَرفًا تَحتَ نَحوٍ أَصيلٍ مُنضَبِط. التَّفصيلُ الكامل: quranic-loanword-audit-ar.md.
لا يَرقى زَوجٌ إلى الصِّنف الأوّل إلّا إذا اجتاز الضوابطَ الأربعة مُجتَمعةً: تَطابُقُ الأصول الحَرفيّة (عَبر قوانين الإبدال الصوتيّ عند خشيم) · اتّحادُ النَّواة (البَذرة الدلاليّة الثنائيّة تَنجو في العُبور بين اللغتَين) · إدراكُ القارئ المُعاصِر · شاهدٌ من فَصيلتَين ساميّةٍ وهندوأوروبيّة. انظر tafsir-coran-tier-a-cognates.md لِسجلّ الصِّنف الثاني الكامل والأنماط المُضادّة.
The 19 Tier-A cross-linguistic cognatesالنَّظائر التِّسعة عَشَر بين اللغات، الصنف الأوّل
| Arabic rootالجذر العربيّ | Cognateالنَّظير | Skeletonالهيكل | Shared nucleusالنواة المُشتَركة | Home verseآية المرجع |
|---|---|---|---|---|
| ك-ف-ء | copy / copie / כפל (Heb) | K-F | the second-instance that lines up against the firstالمِثلُ الذي يُحاذي الأصل | 112:4 |
| س-ل-م | shalom (Heb) / shalmā (Aram) | S-L-M | bound completeness, peace-as-wholenessالتَّمامُ المَربوط، السَّلامُ بِمَعنى الكَمال | 97:5 |
| ر-ب-ب | rabbi / rav (Heb) | R-B | the expansive holder, master-by-nurtureالمُمسِكُ المُوَسِّع، السَّيِّدُ بِالتَّربية | 1:2 |
| ج-ن-ن | genie / genus | G-N | born-from-a-hidden-source, kin-bearing concealmentالمَولودُ من أصلٍ خَفيّ، اِستِتارٌ يَحمل نَسبًا | 114:6 |
| ك-ل-م | claim / clamor (Lat. clamare) | K-L-M | utter-with-intent, the spoken claim that landsالقَولُ بِقَصد، الدَّعوى المَلفوظة تَبلُغ | 2:75 |
| ق-و-ل | call (PIE *kel-) | K/Q-L | the summon-uttered, the audible-reachالنِّداء المَلفوظ، البُلوغُ المَسموع | 112:1 |
| ش-ر-ب | sorb / absorb / syrup | S-R-B | the take-in of fluid, absorbing-flowتَلَقِّي السَّائل، امتصاصُ الجَريان | 2:60 |
| ج-م-ع | Gemini / gemellus | G-M / J-M | gathered-into-pair, together-as-oneمَجموعانِ في قِران، الاثنَين كَواحد | 2:148 |
Tier-A · The Semitic siblings, Arabic ↔ Hebrew + Aramaic (the unity baseline)الصِّنفُ الأَوّل · الأَخَواتُ الساميّة، العَرَبيّة ↔ العِبريّة + الآراميّة (خَطُّ الأَساس)
Hebrew and Aramaic are not a test of the framework; they are the same Semitic tongue as Arabic, split by regular rule not long ago. Of course they share قَلب/heart and مَوت/death: that is common descent, which plain comparative Semitics already explains. So we do not claim the sibling numbers (Hebrew 84%, Aramaic 97% top-tier) as evidence for the letter-charge thesis. They are the unity baseline, expected, and high by construction. The framework's real evidence lies elsewhere: (1) within Arabic itself, reading meaning out of the letter-gestures across 2,285 roots; (2) the phenomenological why the siblings never give, comparative Semitics says "death is a shared root," the framework says why that sound means death (the gathering-sealing-completion gesture), the full reading of the deepest shared roots is here; and (3) the reach beyond the siblings, into Egyptian (a 6,000-year split) and Indo-European (a separate family on the standard tree), where shared vocabulary is not obvious. The gradient across the branches, siblings ~90%, super-family ~56%, the most distant branches lower, is not a signal fading into noise; it is a preservation gradient: how much of the original tongue's sound-meaning logic each branch kept. Arabic kept it most intact; the further a branch eroded, the more scattered its surviving traces, but where a trace survives, read through the fixed charges, it still composes to the same meaning. That convergence of meaning across branches long drifted apart is what points back to one original tongue, the original Arabic. The four-bar rubric is the honesty filter that keeps genuine traces and turns away forced look-alikes, not a rule that distance equals doubt.
العِبريّةُ والآراميّةُ ليسَتا اختبارًا لِلإطار، هُما نَفسُ اللِّسانِ الساميِّ مَع العَرَبيّة، انقَسَمَ بِقاعِدةٍ مُنتَظِمةٍ مُنذُ زَمَنٍ غَيرِ بَعيد. بِالطَّبعِ تَتَشارَكُ القَلبَ والمَوتَ: ذلكَ أَصلٌ مُشتَرَك تُفَسِّرُه اللِّسانياتُ السامِيّةُ المُقارَنةُ أَصلًا. لِذا لا نَدَّعي أَرقامَ الأَخَوات (العِبريّة 84٪، الآراميّة 97٪) دَليلًا عَلى أَطروحةِ شَحَنات الحُروف. هي خَطُّ أَساسِ الوَحدة، مُتَوَقَّعٌ، عالٍ بِالبِنية. دَليلُ الإطارِ الحَقيقيُّ في غَيرِ ذلك: (1) داخِلَ العَرَبيّةِ نَفسِها، قِراءةُ المَعنى مِن حَرَكاتِ الحُروفِ عَبرَ 2,285 جَذرًا؛ (2) تَفسيرُ لِماذا، وهو ما لا تُعطيه الأَخَوات: المُقارَنةُ تَقول «المَوتُ جَذرٌ مُشتَرَك»، والإطارُ يَقول لِماذا يَعني ذلكَ الصَّوتُ المَوتَ (حَركةُ التَّجَمُّعِ-الخَتمِ-التَّمام)، القِراءةُ الكامِلةُ لِأَعمَقِ الجُذورِ المُشتَرَكة هُنا؛ (3) الوُصولُ أَبعَدَ مِنَ الأَخَوات، إلى المِصريّة (انقِسامٌ عُمرُه 6,000 سَنة) والهندوأوربيّة، حَيثُ المُفرَداتُ المُشتَرَكةُ ليسَت بَدَهيّة. التَّدَرُّجُ عَبرَ الفُروع، الأَخَوات ~90٪، الأُسرةُ الكُبرى ~56٪، والفُروعُ الأَبعَدُ أَدنى، ليسَ إشارةً تَتَلاشى في ضَجيج؛ بَل هو تَدَرُّجُ حِفظ: كَم حَفِظَ كُلُّ فَرعٍ مِن مَنطِقِ النُّطق-المَعنى لِلِّسانِ الأَصليّ. العَرَبيّةُ حَفِظَتهُ أَتَمَّ حِفظ، وكُلَّما تآكَلَ الفَرعُ تَبَعثَرَت آثارُه الباقِية، لَكِن حَيثُ يَبقى أَثَرٌ، يُقرَأُ عَبرَ الشَّحَناتِ الثابِتة، فإنّه لا يَزالُ يُرَكِّبُ المَعنى نَفسَه. وهذا التِقاءُ المَعنى عَبرَ فُروعٍ تَباعَدَت طَويلًا هو ما يَدُلُّ على لِسانٍ أصليٍّ واحِد، العَربيّةِ الأولى. والضَّوابطُ الأربعةُ مِصفاةُ صِدقٍ تُبقي الأَثَرَ الحَقيقيَّ وتَرُدُّ التَّشابُهَ المُفتَعَل، لا قاعِدةٌ تَجعَلُ البُعدَ شَكًّا.
Arabic ↔ Hebrew, 219 entries, 84% top-tier (117 PERFECT). The PERFECT share alone (53%) dwarfs Egyptian's 4%. Whole fields come over intact: the numbers 1–1000, the body, kinship, the sacred lexicon (نَبيّ↔navi, كاهِن↔kohen, قُدُس↔qadosh). It also closes the لِسان metathesis: Hebrew lashon keeps the ل, completing the Coptic / Hebrew / Arabic triple-witness. roster · data.
العَرَبيّة ↔ العِبريّة، 219 مَدخَلًا، 84٪ في أَعلى ثَلاثة أَصناف (117 تامّ). نِسبةُ التامّ (53٪) تَفوقُ المِصريّةَ (4٪) بِأضعاف. حُقولٌ كامِلةٌ تَعبُر سالِمة: الأَعداد 1–1000، الجَسَد، القَرابة، المُعجَمُ المُقَدَّس. الرُّوزنامة · البَيانات.
Arabic ↔ Aramaic, 96 entries, 97% top-tier (62 PERFECT). Aramaic completes the trio and shows the one-tongue divergence happening by rule: أرض→arʿā (ḍ→ʿ), ذهب→dahab (ḏ→d), ثلاث→tlāt (ṯ→t), سلام→shlama (s↔š). The regularity of the shifts is itself the signature of a single language diverging, not a scatter of coincidences. data.
العَرَبيّة ↔ الآراميّة، 96 مَدخَلًا، 97٪ في أَعلى ثَلاثة أَصناف (62 تامّ). الآراميّةُ تُكمِلُ الثُّلاثيَّ وتُري انقِسامَ اللِّسانِ الواحِدِ يَجري بِقاعِدة: أرض→arʿā، ذهب→dahab، ثلاث→tlāt، سلام→shlama. انتِظامُ الإبدالاتِ نَفسُه هو تَوقيعُ لُغةٍ واحِدةٍ تَتَشَعَّب، لا مُصادَفاتٌ مُبَعثَرة. البَيانات.
Arabic ↔ Akkadian, 75 entries, 93% top-tier (24 PERFECT). Akkadian is the oldest attested Semitic, the earliest written sister of Arabic (~2500 BCE), so it pushes the unity baseline back two millennia. Its signature is the loss of the gutturals (بَعل baʿl → bēlu lord · عَين ʿayn → īnu eye · أَرض ʾarḍ → erṣetu earth) alongside the regular interdental shifts (ثَلاث → šalāš, أُذُن → uznu, اسم → šumu). Whole core fields cross intact, the body, kinship, the numbers, the pronouns (أنا↔anāku, أنتَ↔atta). Five honest parallel-stems (king↔šarru, son↔māru) are kept low, not forced. That a sister this old still reads this cleanly through the same fixed charges deepens the trace of the one original source. data.
العَرَبيّة ↔ الأَكّاديّة، 75 مَدخَلًا، 93٪ في أَعلى الأَصناف (24 تامّ). الأَكّاديّةُ أَقدَمُ ساميّةٍ مُدَوَّنة، أَوّلُ أَخَواتِ العَرَبيّةِ كِتابةً (~2500 ق.م)، فتَدفَعُ خَطَّ أَساسِ الوَحدةِ أَلفَي عامٍ إلى الوَراء. تَوقيعُها سُقوطُ الحُروفِ الحَلقيّة (بَعل → bēlu رَبّ · عَين → īnu · أَرض → erṣetu) مع الإبدالاتِ المُنتَظِمة (ثَلاث → šalāš، أُذُن → uznu، اسم → šumu). حُقولٌ جَوهَريّةٌ كامِلةٌ تَعبُرُ سالِمة، الجَسَد، القَرابة، الأَعداد، الضَّمائر (أنا↔anāku). وخَمسةُ جُذورٍ مُوازِيةٍ صادِقة (مَلِك↔šarru، ابن↔māru) تُبقى مُنخَفِضةً بِلا افتِعال. وأنْ تُقرَأَ أُختٌ بِهذا القِدَمِ بهذا الوُضوحِ عَبرَ نَفسِ الشَّحَناتِ الثابِتةِ يُعَمِّقُ أَثَرَ المَصدَرِ الأصليِّ الواحِد. البَيانات.
العِبريّةُ أَقرَبُ إلى العَرَبيّة مِن المِصريّةِ القَديمة، فَهُما تَتَشارَكانِ الوالِدَ الساميَّ المُباشِر. وَتَنبُّؤُ الإطارِ بِالمَسافةِ الأُسَريّةِ يَقول إنّ العِبريّةَ يَنبَغي أَن تُقرَأ أَنظَفَ بَعدُ مِن المِصريّة، وَالرُّوزنامةُ الآنَ بِـ219 مَدخَلًا تُؤَكِّدُ ذلك بِحَسم: 117 تامّ (نَفسُ الجَذرِ بِلا إبدال) + 4 بِدائيّةٌ أُسَريّة + 64 قَويّ (إبدالٌ ساميٌّ مُنتَظِم مِثل ث↔š، ض↔ts، ذ↔z) = 185 / 219 في الطَّبَقاتِ العُليا (84٪). نِسبةُ التامّ وَحدَها (53٪) تَفوقُ المِصريّةَ (4٪) بِأضعاف. حُقولٌ دَلاليّةٌ كامِلةٌ تَعبُر سالِمة، الأَعداد 1–1000، الجَسَد، القَرابة، المُعجَمُ المُقَدَّس (نَبيّ↔נָבִיא، كاهِن↔כֹּהֵן، قُدُس↔קָדוֹשׁ، سَجَد↔סָגַד). التَّدَرُّج، العِبريّة 84٪، المِصريّة ~56٪، الهندوأوربيّة المُعايَرة 25٪، مُثَبَّتٌ الآنَ عِند ثَلاثِ نِقاطٍ في الاتّجاهِ المُتَوَقَّع. التَّفصيل: tier-a-hebrew-cognates.md · البَيانات: hebrew-cognates.json.
Tier-A · Afro-Asiatic · Arabic ↔ Ancient Egyptian (200-entry close-family roster)الصِّنفُ الأَوّل · الأَفروأَسيويّة · العَرَبيّة ↔ المِصريّة القَديمة (روزنامةُ الأُسرةِ القَريبة · 200 مَدخَلًا)
The Indo-European roster above tests the framework against distant relatives of Arabic. The framework's deeper prediction is that resonance should be cleanest where the family tie is closest, and Arabic's closest family is Afro-Asiatic (Egyptian, Hebrew, Aramaic, Berber, Ge'ez). This roster of 324 Arabic ↔ Ancient-Egyptian pairs (and growing) reads under the same operative grammar without forcing across the full vocabulary spectrum: 11 PERFECT (same root, no shifts) + 7 PROTO-AFRO-ASIATIC (family-shared pronouns and particles) + 1 DUAL-FACE PAIR + 78 STRONG (predictable articulator-class shifts) + 18 PARTIAL + 84 PROVISIONAL. Top-three-tier hit-rate: 179 / 324 = 55% (was 52%, and still climbing), twice the calibrated distant-IE rate. Deep-family-core hit-rate (the 20 most-shared family-wide words like eye, mother, water, die, soul, the pronouns): 90%. The audit surfaces 30+ structural revelations the framework brought to the surface, metathesis cognates like لِسان ↔ ns (Coptic ⲗⲁⲥ restores the ل), dual-face L3 swaps like رود/روض, polysemy as evidence of shared seed (Egyptian snt = tooth + sister + second on one nucleus), and articulator-class shifts that align hidden semantics (حَيّ ↔ ʿnḫ, جانِب ↔ gs, سَمِع ↔ sḏm). Full per-word readings: tier-a-afro-asiatic-cognates.md.
الرُّوزنامةُ الهندوأوربيّةُ أَعلاهُ تَختَبِرُ الإطارَ في مُواجَهةِ أَقرِباءَ *بَعيدين* لِلعَرَبيّة. وَالتَّنَبُّؤُ الأَعمَقُ لِلإطار أَنّ الصَّدى يَنبَغي أَن يَكون أَنظَفَ حَيثُ الرَّوابِطُ الأُسَريّةُ أَقرَب، وَأَقرَبُ أُسرةٍ لِلعَرَبيّةِ هي الأَفروأَسيويّة (المِصريّة، العِبريّة، الآراميّة، الأَمازيغيّة، الجِعزيّة). هذه الرُّوزنامةُ بِـ324 زَوجًا عَرَبيًّا ↔ مِصريًّا قَديمًا (وفي نُمُوّ) تَقرَأ تَحتَ نَفسِ النَّحوِ العَمَليّ بِلا افتِعال عَبرَ طَيف المُفرَدات كُلِّه: 11 تامّ + 7 بِدائيّةٌ أَفروأَسيويّة + 1 زَوجٌ ذو وَجهَين + 78 قَويّ + 18 جُزئيّ + 84 مُؤَقَّت. مُعَدَّلُ الإصابةِ في أَعلى ثَلاثة أَصناف: 179 / 324 = 55% (كان 52%، وفي صُعود)، ضِعفُ ما في الحَوضِ الهندوأوربيّ المُعايَر. وَفي القَلبِ العَميقِ المُشتَرَك (الـ 20 كَلِمة الأَكثَر اشتِراكًا أُسَريًّا، عَين، أُمّ، ماء، مات، نَفس، الضَّمائر): 90%. أَطلَعَ التَّدقيقُ 30+ كَشفًا بِنيَويًّا، جِنَاسات بِقَلب المَواضِع مِثل لِسان ↔ ns (القِبطيّةُ ⲗⲁⲥ تَستَعيدُ اللام)، وَإبدالات وَجهَين عَلى L3 مِثل رود/روض، وَتَعَدُّد دَلالات كَدَليل عَلى البَذرة المُشتَرَكة (المِصريّ snt = سِنّ + أُخت + ثانٍ عَلى نَواةٍ واحِدة)، وَإبدالات صَوتيّة تُحاذي دَلالاتٍ مَخفيّة (حَيّ ↔ ʿnḫ، جانِب ↔ gs، سَمِع ↔ sḏm). التَّفاصيل: tier-a-afro-asiatic-cognates-ar.md.
| Egyptianالمِصريّ | Arabic cognateالنَّظيرُ العَرَبيّ | Form classالتَّصنيفُ الشَّكليّ | Shared seed-meaningبَذرةُ المَعنى المُشتَرَكة | Verdictالحُكم |
|---|---|---|---|---|
| سخسخ sḫsḫ | سَخَّ · "running" | reduplicated XYXYمُكَرَّر XYXY | سخ: sliding-flow piercing forward, doubledسخ: انزِلاقٌ خَرّاقٌ مُضَعَّف | PERFECT |
| دي dy | ذا / ذي · "here, this" | bare binaryثُنائيٌّ عارٍ | دي: settled-point gently pointed-toدي: نُقطةٌ مَضبوطةٌ يُشارُ إلَيها بِلَطف | PROTO-FAMILY |
| واسخ wsḫ | واسِع · "wide" | prefixed trilateralثُلاثيٌّ بِبادِئة | و+سخ: bound extension piercing outward to widthو+سخ: امتدادٌ مَربوطٌ يَختَرِقُ إلى السَّعة | DUAL-FACE PAIR |
| جعجع jʿjʿ | جَعْجَعَ · "dazzled" | reduplicated XYXYمُكَرَّر XYXY | جع: intense gathering surging from depth-grip, doubledجع: تَدَفُّقٌ مُفاجِئٌ مِن قَبضةِ عُمق، مُضَعَّف | STRONG |
| بطط bṭṭ | بَطَّ / بَطَحَ · "flatten" | geminate XYYمُضَعَّف XYY | بط: sealed attachment + heavy spreading-pressureبط: التِصاقٌ مَختومٌ + ضَغطٌ ناشِرٌ ثَقيل | STRONG |
| مقير mqyr | مَقهور · "miserable" | trilateral on مَفعيلثُلاثيّ عَلى مَفعيل | مق: bound-down mass with thin trickleمق: كَتلةٌ مَكبوتةٌ مَع خَيطٍ رَفيع | STRONG |
| رود/روض rwd/rwḏ | رَوْد / رَوْض · "stairway road" | trilateral · dual-face on L3 (د/ض)ثُلاثيّ · وَجهانِ عَلى L3 (د/ض) | رو: walked binding settling / cleared-open spreadرو: رَبطٌ مَطروقٌ مُستَقِرّ / انبِساطٌ مَفتوحٌ مُسَوّى | PERFECT |
| وبان wbn | بان / أَبان · "appear" | prefixed bare-binaryثُنائيٌّ بِبادِئة | بن: what was sealed-inside released into outward resonanceبن: ما خُتِم في الباطِنِ يَنطَلِقُ رَنينًا إلى الخارِج | PERFECT |
| خم ḫm | خَمَّ / خامَ · "callout / cheat" | bare binaryثُنائيٌّ عارٍ | خم: piercing into the sealed-massخم: اختِراقٌ في المَجموعِ المَختوم | STRONG |
| بس bs | بس / بَسَّ · "if only" | bare binary (particle)ثُنائيٌّ (أَداة) | بس: bound-passage letting only a thin stream throughبس: مَمَرٌّ مَربوطٌ يُمَرِّر تَيّارًا رَفيعًا فَقَط | STRONG |
| جسر jsr | جِسر · "clear road / bridge" | trilateralثُلاثيّ | جسر: gathered crossing-space extending and runningجسر: حَيِّزُ عُبورٍ يَمتَدُّ ويَجري | PERFECT |
| عَين ʿn | عَين · "eye, source, spring" | bare binary · cross-family universalثُنائيّ · كَونيُّ الأُسرة | عن: intense grip from depth that emanates outwardعن: قَبضٌ عَميقٌ يُشِعّ | PERFECT |
| سَمير smr | سَمير · "companion, courtier" | trilateral · exact 3-consonant matchثُلاثيّ · تَطابُقٌ كامِل | سمر: streaming-gathering that runs togetherسمر: السَّيَلانُ المَجموعُ يَجري مَعًا | PERFECT |
| مات mwt | مات · "die" | trilateral · universal Afro-Asiaticثُلاثيّ · كَونيٌّ أَفروأَسيويّ | مو: gathered-sealed mass binds to final completionمو: التَّجَمُّعُ المَختومُ يَنعَقِدُ نِهاية | PERFECT |
| أُمّ mwt | أُمّ · "mother" | geminate / trilateral · universalمُضَعَّف / ثُلاثيّ · كَونيّ | مم: the gathered originating sourceمم: المَصدَرُ الأَوّليُّ المَجموع | PERFECT |
| ماء mw | ماء · "water" | bare binary · universalثُنائيّ · كَونيّ | مو: bound-gathering, sealed-yet-flowing massمو: الكَتلةُ المَختومةُ السَّيّالة | PERFECT |
| جاء jy | جاء · "come, arrive" | bare binaryثُنائيّ عارٍ | جي: gathered-surfacing extending gently forwardجي: البُروزُ يَمتَدُّ لَطيفًا أَمامَه | PERFECT |
| شَفة spt | شَفة · "lip" | trilateral · ش↔s sibilant shiftثُلاثيّ · إبدالٌ صَفيريّ | شف: front-spreading that parts to release breathشف: الانتِشارُ الأَماميُّ يَنفَرِجُ لِيُطلِقَ النَّفَس | STRONG |
| لِسان ns | لِسان · "tongue" | metathesis cognateجِنَاسٌ بِقَلب | سن: fine flow resonating from inside · Coptic ⲗⲁⲥ restores the لسن: السَّيَلانُ الرَّفيعُ يَرِنّ · القِبطيّةُ تَستَعيدُ اللام | STRONG |
| جانِب gs | جانِب · "side, half" | trilateral · ج↔g (Khshim L3)ثُلاثيّ · ج↔g | جن/gs: gathered-surface extending from the central bodyجن: سَطحٌ مَجموعٌ يَمتَدُّ مِن الجَسَدِ المَركَزيّ | STRONG |
| حَيّ ʿnḫ | حَيّ · "alive, life" | trilateral · ح↔ʿ (Khshim L6)ثُلاثيّ · ح↔ʿ | حي: warm grip from depth projecting outwardحي: قَبضٌ حَيٌّ مِن العُمقِ يُشِعُّ خارِجًا | STRONG |
| سَمِع sḏm | سَمِع · "hear, obey" | trilateral · ع↔ḏ cross-familyثُلاثيّ · ع↔ḏ | سم: extending stream that gathers/pierces inwardسم: السَّيَلانُ يَتَجَمَّعُ وَيَنفُذُ داخِلًا | STRONG |
| نَحنُ jn-n | نَحنُ · "we" | Proto-Afro-Asiatic pronoun stemضَميرٌ بِدائيٌّ أَفروأَسيويّ | ن: shared inner resonance, the inside-groupن: الرَّنينُ الداخِليُّ المُشتَرَك، المَجموعةُ الداخِليّة | PROTO-FAMILY |
| مِن m | مِن · "from, in, with" | single-letter preposition · universalحَرفُ جَرٍّ مُفرَد · كَونيّ | م: relational gathering-marker, the all-purpose prepositionم: مارِكَرُ التَّجَمُّعِ العَلاقيّ، حَرفُ الجَرّ الجامِع | PROTO-FAMILY |
| أَنف fnḏ | أَنف · "nose" 🔑 | trilateral · metathesis (ʾ-n-f ↔ f-n-ḏ)ثُلاثيّ · جِنَاسٌ بِقَلب | نف/fn: inner resonance + parting-the-breath, the organ where breath parts inwardنف: رَنينٌ داخِليٌّ + شَقُّ النَّفَس | STRONG |
| إِصبَع ḏbʿ | إِصبَع · "finger" 🔑 | trilateral · ع shared exactly across the familyثُلاثيّ · العين مُشتَرَكة | صب/ḏb + ع: firmly-attached pointed depth-gripصب + ع: تَعَلُّقٌ مُحكَمٌ بِقَبضٍ عَميق | STRONG |
| نَفس nfsw | نَفس · "soul, breath, self" | trilateral · n-f-s exact match across whole familyثُلاثيّ · تَطابُقٌ كامِلٌ في الأُسرة | نف + س: inner-resonance + parting-flow, the breath-as-soulنف + س: الرَّنينُ الباطِنُ المُمتَدّ، النَّفَسُ-الرُّوح | PERFECT |
| آمَن mn | آمَن · "believe, be steadfast" 🔑 | bare-binary · the "amen" rootثُنائيّ · جَذرُ «أَمين» | من/mn: gathering + inner-resonance, the steadfast holdingمن: تَجَمُّعٌ ثابِتٌ يَرِنّ، الإيمانُ الصَّامِد | STRONG |
| أَحَبَّ mrj | أَحَبَّ · "love" 🔑 | trilateral · same m-r seed as مَرِض "to suffer"ثُلاثيّ · نَفسُ بَذرة مَرِض | مر: passing-running flow, love and pain on one nucleusمر: جَريانٌ عابِر، الحُبُّ والمُعاناةُ في بَذرةٍ واحِدة | STRONG |
| خاف snḏ | خاف · "fear" | trilateral · parallel s-n fear-stemثُلاثيّ · جَذرٌ s-n مُوازٍ | سن fear-stem also gives Arabic سَكَن "silence-from-fear"جَذرُ الخوفِ يُعطي السَّكَن أَيضًا | STRONG |
| خَتَم ḫtm | خَتَم · "seal, shut" | trilateral · exact 3-consonant match · no shiftsثُلاثيّ · تَطابُقٌ تامّ | ختم: piercing-firmly that gathers-and-seals, the seal-actختم: نَفاذٌ مُحكَمٌ يَختِم | PERFECT |
| نَزَل hꜣy | نَزَل / هَوى · "descend, alight" (cross-linked to هَوى) | trilateral · same root as هَوىثُلاثيّ · نَفسُ جَذرِ هَوى | هو: soft breath that binds and descends gentlyهو: نَفَسٌ ناعِمٌ يَرتَبِطُ وَيَنزِل | PERFECT |
| جَهل ḫm | جَهل · "ignorance" 🔑 | bare-binary · SAME nucleus as خم "cheat" (#9)ثُنائيّ · نَفسُ نَواة خم | خم: piercing the sealed-mass, both ignorance (blocked) and cheat (broken) on one seedخم: اختِراقُ المَختوم، الجَهلُ والغِشُّ في بَذرةٍ واحِدة | STRONG |
| جَلَس ḥmsj | جَلَس · "sit, dwell" | trilateral · exact ḥ-m-s preservedثُلاثيّ · ح-م-س مَحفوظ | حمس: warm-gathered-streaming = the dwelling-residing postureحمس: تَجَمُّعٌ حَيٌّ سَيّال، المُكوث | STRONG |
| سَفَر sfr | سَفَر · "travel, depart" | trilateral · exact 3-consonant matchثُلاثيّ · تَطابُقٌ تامّ | سفر: extending-flow + parting + running, the journey-outسفر: سَيَلانٌ + شَقٌّ + جَريان، الرَّحيل | STRONG |
| لَبِس ḥbs | لَبِس · "wear, clothe" 🔑 | trilateral · b-s clothing-stem preserved with ل/ḥ variantثُلاثيّ · ب-س جَذرُ اللِّباس | بس: bound-passage that streams over, the clothing coveringبس: مَمَرٌّ مُلتَصِقٌ يَنسَكِب فَوقَ الجِسم | STRONG |
| سَتَر sḏr | سَتَر · "cover, conceal, lie-down" | trilateral · ت↔ḏ dental shiftثُلاثيّ · ت↔ḏ | ست + ر: streaming-completion that runs continuously, the night-coverست + ر: تَمامٌ سَيّالٌ يَجري، غِطاءُ اللَّيل | STRONG |
| مَرِض mr | مَرِض · "be sick, suffer" 🔑 | trilateral · exact m-r match · same seed as "love"ثُلاثيّ · م-ر · نَفسُ بَذرة الحُبّ | مر: passing-running pain, and the same nucleus also carries loveمر: جَريانُ الأَلَم، ونَفسُ النَّواةِ تَحمِلُ الحُبَّ | STRONG |
| شَفى snb | شَفى · "heal, make whole" | trilateral · health-stem on s-n baseثُلاثيّ · جَذرُ العافِية | سن: restoring-flow that binds, the body made wholeسن: سَيَلانٌ مُرَمِّمٌ يَرتَبِط، العافِية | STRONG |
| شَنّ šn | شَنّ · "surround, encircle" | geminate · exact two-way match · the shen-ring rootمُضَعَّف · جَذرُ حَلَقةِ شَن | شن: wide spread that resonates inward, the encircling-loadشن: انتِشارٌ يَرِنُّ داخِلًا، الإحاطة | STRONG |
| أَنا jnk | أَنا · "I" | nasal pronoun stem · universal Afro-Asiaticضَميرٌ ناسِخٌ · كَونيّ | أن/jn: originating-affirmation + inner-resonance, the self-asserting voiceأن: تَأكيدُ النَّفس، الصَّوتُ الذاتيّ | PROTO-FAMILY |
| أَنتَ ntk | أَنتَ · "you (m.)" | n+t pronoun stem · universalضَميرٌ · كَونيّ | نت: inner-resonance extended outward to youنت: رَنينٌ مُمتَدٌّ إلَيكَ | PROTO-FAMILY |
| قَدِم/قَديم qd | قَدِم / قَديم · "ancient, build, form" | trilateral · q-d exact matchثُلاثيّ · ق-د تَطابُق | قد: firm-cut settled fixity, the established-of-oldقد: قَطعٌ مُحكَمٌ مُستَقِرّ، القَديمُ المَبنيّ | STRONG |
| حَكَم ḥkꜣ | حَكَم / حِكمة · "wisdom, judge, magic" | trilateral · h-k preservedثُلاثيّ · ح-ك مَحفوظ | حك: warm containment held in sealed precision, wisdom-as-secret-knowledgeحك: احتِواءٌ مَختومٌ بِدِقّة، الحِكمة | STRONG |
| حَطّ ḥtp | حَطّ · "settle, rest, contented" | geminate/trilateral · ح-ط preservedمُضَعَّف · ح-ط | حط: warm containment + heavy spreading, settling-into-restحط: احتِواءٌ + انبِساطٌ ثَقيل، السُّكون | STRONG |
| جسر jsr | جِسر · "bridge, crossing" | trilateral · same rootثُلاثيّ · نَفسُ الجَذر | جس + ر: gathered crossing extending and runningجس + ر: حَيِّزٌ يَمتَدُّ ويَجري | PERFECT |
| يَمّ yam | يَمّ · "sea, ocean" | cross-family universal · also Hebrew יָם, Akkadian yamuكَونيّ في الأُسرة · עברית יָם | يم: gentle-extension binding the gathered mass, the seaيم: امتدادٌ يَربِطُ الكَتلةَ، البَحر | STRONG |
| عَيش ʿqw | عَيش · "bread, life-sustenance" | trilateral · ع shared in family bread-stemثُلاثيّ · العين في جَذرِ الخُبز | عيش: depth-grip + flow, bread as the life-giving sustenanceعيش: قَبضُ العُمق + سَيَلان، الخُبزُ يُحيي | STRONG |
▸ Open the interactive 200-entry browser (sort · filter · search · 🔑 revelations) →▸ افتَح المُتَصَفِّحَ التَّفاعُليَّ لِلـ200 مَدخَل (تَرتيب · تَصفِية · بَحث · 🔑 الكَشوفات) ←
→ Or read the full markdown audit with per-entry framework reading← أَو اقرَأ التَّدقيقَ الكامِل بِقِراءةٍ مُفَصَّلةٍ لِكُلّ مَدخَل
·
⬇ JSON data⬇ بَيانات JSON
199 of 200 framework-readable (99.5%) · 0 forced. Verdict distribution across the full vocabulary spectrum: 11 PERFECT (same root, zero shifts) + 7 PROTO-AFRO-ASIATIC (family-shared pronouns/particles) + 1 DUAL-FACE PAIR + 78 STRONG (predictable articulator-class shifts) + 18 PARTIAL + 84 PROVISIONAL. Top-three-tier hit-rate: 55%, over twice the calibrated distant-IE pool (25%). Deep-family-core hit-rate (the 20 most-shared family-wide words): 90%. The PROVISIONAL share is honest: once you go past the most-shared vocabulary into animals, plants, tools, abstract terms, categories where surface lexicon naturally diverged across 6,000 years, the framework still *reads* the words coherently, but the consonants no longer align directly. The structural revelations the audit surfaced (metathesis cognates, dual-face L3 swaps, polysemy as evidence of shared seed, articulator-class shifts that align hidden semantics) are catalogued in a dedicated section of the doc.
199 مِن 200 يَقرَؤها الإطار (99.5%) · 0 افتِعال. التَّوزيع عَبرَ طَيف المُفرَدات كُلِّه: 11 تامّ + 7 بِدائيّةٌ أَفروأَسيويّة + 1 زَوجٌ ذو وَجهَين + 78 قَويّ + 18 جُزئيّ + 84 مُؤَقَّت. مُعَدَّلُ الإصابةِ في أَعلى ثَلاثة أَصناف: 55%، أكثَرُ مِن ضِعفِ الحَوضِ الهندوأوربيّ المُعايَر (25%). وَفي القَلبِ العَميقِ المُشتَرَك (الـ 20 كَلِمةَ الأَكثَر اشتِراكًا أُسَريًّا): 90%. نِسبةُ المُؤَقَّت صادِقة: حينَ نَتَجاوَزُ المُفرَداتِ الأَكثَر اشتِراكًا إلى الحَيوانات وَالنَّبات وَالأَدَواتِ وَالمُصطَلَحاتِ المُجَرَّدة، فِئاتٌ تَباعَدَت طَبيعيًّا عَبرَ 6,000 سَنة، يَبقى الإطارُ يَقرَأ الكَلِماتِ بِتَماسُك، لَكِنَّ الصَّوامِتَ لم تَعُد تَتَطابَق مُباشَرة.
↑ The number was never a ceiling, 52% → 55% on honest re-attack. A second-attack audit re-examined every entry the first pass filed as "different roots," and a large share cracked open once we looked for the right Arabic word instead of the obvious one (ḏw "mountain" → طَود not جبل · ḏrt "hand" → ذِراع · qs "bone" → قَصَب · sšn "lotus" → سَوسَن). Two further rounds confirmed those and mined 83 cracked-or-new pairs this session, several exact 3-consonant matches (ḫsf ↔ خَسَف · šnꜥ ↔ شَنِئ · ḥḏn ↔ حَزَن · ḏrw ↔ ذِروة). 52% was never a ceiling, it measured how early we stopped looking. Full re-attack + open cases being solved together: second-attack · rounds 3–4.
↑ الرَّقمُ في ارتِفاع، لا ثابِت. أعادَت مُراجَعةُ «الهُجوم الثاني» فَحصَ كُلِّ مَدخَلٍ صَنَّفَه التَّمريرُ الأوّلُ «جُذورًا مُختَلِفة»، فانفَتَحَ كثيرٌ منها حينَ بَحَثنا عَنِ الكَلِمةِ العَرَبيّةِ الصَّحيحة بَدَلَ الظاهِرة (ḏw «جَبَل» ← طَود لا جبل · ḏrt «يَد» ← ذِراع · qs «عَظم» ← قَصَب · sšn «لوتس» ← سَوسَن). الـ52% لم تَكُن سَقفًا قَطّ، كانَت تَقيسُ كَم بَكَّرَ التَّمريرُ الأوّلُ في التَّوَقُّف. الهُجومُ الكامِلُ + الحالاتُ المَفتوحةُ قَيدَ الحَلّ: 2026-05-24-aa-second-attack.md.
The Coptic restoration layer, the spoken third witnessطَبَقةُ الاستِعادة القِبطيّة، الشاهِدُ الناطِقُ الثالِث
Hieroglyphic Egyptian was written consonantally, so it dropped weak sounds, which is why لِسان (l-s-n) looked unrelated to hieroglyphic ns. But Coptic, the spoken descendant, restores them: Coptic ⲗⲁⲥ las brings the ل back, and the cognate closes. This 33-entry layer adds that spoken third witness to the Egyptian roster, most entries confirm already-attested cognates rather than making new claims, so it is graded honestly: 2 PERFECT · 23 STRONG · 7 PARTIAL · 1 PROVISIONAL (76% top-tier). Flagship restorations: لِسان↔ns↔ⲗⲁⲥ · نَفْس↔nfsw↔ⲛⲓϥⲉ · ماء↔mw↔ⲙⲱⲟⲩ · مات↔mwt↔ⲙⲟⲩ · طُوب↔ḏbt↔ⲧⲱⲱⲃⲉ. Data: coptic-cognates.json · reading: coptic-egyptian-echoes.md.
المِصريّةُ الهيروغليفيّةُ كُتِبَت بِالصَّوامِت، فأَسقَطَت الأَصواتَ الضَّعيفة، ولِذا بَدَت لِسان (ل-س-ن) غَيرَ مُتَّصِلةٍ بِالهيروغليفيّ ns. لَكِنّ القِبطيّةَ، الذُّرِّيّةَ المَنطوقة، تَستَعيدُها: القِبطيّةُ ⲗⲁⲥ las تُعيدُ اللامَ، فيَنغَلِقُ الجِنَاس. هذه الطَّبَقةُ (33 مَدخَلًا) تُضيفُ الشاهِدَ الناطِقَ الثالِثَ، ومُعظَمُها يُؤَكِّدُ جِنَاساتٍ مُثبَتةً سَلَفًا، فدُرِّجَت بِصِدق: 2 تامّ · 23 قَويّ · 7 جُزئيّ · 1 مُؤَقَّت (76٪). البَيانات: coptic-cognates.json.
Sanskrit, the most distant branch, read through the same fixed chargesالسنسكريتيّة، أبعَدُ الفُروع، تُقرَأُ بِنَفسِ الشَّحَناتِ الثابِتة
Sanskrit is the most distant branch tested. We do not grade it by genetic cognacy, we read each word's own sounds through the 28 fixed charges and ask one question: does the gesture compose to its attested meaning? In the deep core, kin, body, number, basic action, it does, and it composes cleanly: 30 worked entries · 11 PERFECT · 18 STRONG · 1 PARTIAL (97% top-tier). Several land exact through the charges: قرن↔karṇa (k-r-n ↔ q-r-n, the curved projection with a resonance cavity = horn / ear), منى↔man (m-n, inner concentration rising as thought), طنّ↔tan (ṭ-n, the dental pull into a vibrating line = tension), مخّ↔makha (m-ḫ, the gathered mass pierced = inner essence), نخس↔nakha (n-ḫ, the directional point that pricks = nail), ناموس↔namas (n-m-s exact = bowing in reverent submission). These are not borrowing claims, and not coincidences at distance: when the same gesture builds the same meaning this far out, the framework reads it as a surviving trace of one original tongue, the original Arabic, whose sound-meaning logic Qur'anic Arabic kept most intact. The reading is honest, not blind: the single PARTIAL (أخ↔bhrātṛ) is where the skeleton only half-aligns, read, not forced. Each entry carries its charge-reading and a Monier-Williams source. Data: sanskrit-cognates.json · reading: sanskrit-indo-iranian-echoes.md.
السنسكريتيّةُ أبعَدُ الفُروعِ التي اختَبَرناها. لا نُدَرِّجُها بِالقَرابةِ الجينيّة، بَل نَقرَأُ أَصواتَ كُلِّ كَلِمةٍ بِذاتِها عَبرَ الشَّحَناتِ الثَّمانِ والعِشرينَ الثابِتة، ونَسألُ سُؤالًا واحِدًا: هَل تُرَكِّبُ الإيماءةُ مَعناها المُثبَت؟ في القَلبِ العَميق، القَرابةُ والجَسَدُ والعَدَدُ والفِعلُ الأساس، تُرَكِّبُهُ، وتُرَكِّبُهُ بِوُضوح: 30 مَدخَلًا مَدروسًا · 11 تامّ · 18 قَويّ · 1 جُزئيّ (97٪ في أعلى الأَصناف). وعِدّةٌ مِنها تامّةٌ عَبرَ الشَّحَنات: قرن↔karṇa (q-r-n ↔ k-r-n)، منى↔man (m-n)، طنّ↔tan (ṭ-n)، مخّ↔makha (m-ḫ)، نخس↔nakha (n-ḫ)، ناموس↔namas (n-m-s تامّ). وهذه ليسَت دَعاوى استِعارة، ولا مُصادَفاتٍ عِندَ البُعد: حينَ تَبني الإيماءةُ نَفسُها المَعنى نَفسَه على هذا البُعد، يَقرَؤها الإطارُ أَثَرًا باقِيًا مِن لِسانٍ أصليٍّ واحِد، العَربيّةِ الأولى، حَفِظَت العَربيّةُ القُرآنيّةُ مَنطِقَه أَتَمَّ حِفظ. والقِراءةُ صادِقةٌ لا عَمياء: الجُزئيُّ الوَحيدُ (أخ↔bhrātṛ) هو حَيثُ يَتَطابَقُ الهَيكلُ نِصفًا، قِراءةٌ لا افتِعال. وكُلُّ مَدخَلٍ يَحمِلُ قِراءَتَه الشَّحنيّة ومَصدَرَه مِن مونييه-وِليامز. البَيانات: sanskrit-cognates.json.
The universal floor: the words a baby learns firstالأَرضيّةُ الكَونيّة: الكَلِماتُ التي يَتَعَلَّمُها الطِّفلُ أوّلًا
The preservation gradient, Arabic most intact, then Hebrew, Aramaic, Egyptian, and the more distant branches, raises one question: is there a layer so deep it survives in every branch? There is. Go as far as Chinese, a completely different writing system and structure, and the root-level matches thin out, but the deepest stratum still holds: the words a human infant forms first, mother, I, this, reach for the same mouth-gesture across the branches that drifted furthest apart. This is the floor of the gradient: the original tongue's logic at its most indestructible. It is not zero, it is universal.
تَدَرُّجُ الحِفظ، العَرَبيّةُ أَتَمُّ حِفظًا، ثُمّ العِبريّة، فالآراميّة، فالمِصريّة، فالفُروعُ الأَبعَد، يَطرَحُ سُؤالًا: هَل ثَمّةَ طَبَقةٌ مِنَ العُمقِ بِحَيثُ تَنجو في كُلِّ فَرع؟ نَعَم. اذهَب بَعيدًا كَالصِّينيّة، بِنِظامِ كِتابةٍ وبِنيةٍ مُختَلِفَين كُلِّيًّا، وستَرِقُّ المُطابَقاتُ على مُستَوى الجَذر، لَكِنّ الطَّبَقةَ الأَعمَقَ تَثبُت: الكَلِماتُ التي يُكَوِّنُها الطِّفلُ أوّلًا، أُمّ، أَنا، هذا، تَمُدُّ يَدَها إلى نَفسِ حَركةِ الفَمِ عَبرَ أَبعَدِ الفُروعِ تَباعُدًا. هذه أَرضيّةُ التَّدَرُّج: مَنطِقُ اللِّسانِ الأصليِّ في أَمتَنِ صُوَرِه. ليسَت صِفرًا، هي كَونيّة.
| Meaning · gestureالمعنى · الحركة | عربيّ | עברית | Egyptianمصريّ | 中文 | Other familiesفصائل أخرى |
|---|---|---|---|---|---|
| MOTHER · م lips gather (nursing)انطباقُ الشَّفَتَين (الرَّضاعة) | أُمّ · ماما | אֵם · אִמָּא | mwt | 妈 mā | amma (Tamil) · mama (Swahili, Quechua) |
| I / WE · ن inner resonanceرَنينٌ مِنَ الدّاخِل | أَنا · نَحنُ | אֲנִי · אֲנַחְנוּ | jnk · jn-n | 你 nǐ (you) | anāku (Akkadian) |
| THIS / HERE · د tongue taps to pointنَقرةُ اللسانِ لِلإشارة | ذا · دي · هذا | זֶה | dy · djt | 这 zhè | this / that (English) |
Murdock (1959) surveyed 1,072 languages and found the word for mother uses a nasal (m/n) in the overwhelming majority, far above chance. Jakobson (1960) explained why: the m is the sound a nursing infant makes with lips closed. The framework reads م as gathering, the gathered source, exactly this, from first principles. And Chinese adds a twist: its characters began as pictures (水 was a drawing of flowing water, 山 of mountains). Arabic encodes meaning in the shape the mouth makes; Chinese in the shape the hand draws. Two roads, one destination: meaning living in the form of the sign, not arbitrarily assigned to it. Full evidence + references: universal-baby-words.md.
مَردوك (1959) مَسَحَ 1,072 لُغة فَوَجَدَ أنّ كَلِمةَ الأُمّ تَستَعمِلُ صَوتًا أَنفيًّا (م/ن) في الغالِبيّةِ الساحِقة، فَوقَ الصُّدفةِ بِكَثير. ياكوبسون (1960) فَسَّرَ السَّبَب: الـم هو الصَّوتُ الذي يُصدِرُه الرَّضيعُ بِشَفَتَين مُنطَبِقَتَين. والإطارُ يَقرَأُ م كَـتَجَمُّعٍ، المَصدَرِ المَجموع، هذا بِالضَّبط، مِنَ المَبادئِ الأُولى. والصِّينيّةُ تُضيفُ لَفتة: حُروفُها بَدَأَت صُوَرًا (水 كانَ رَسمًا لِجَريانِ الماء، 山 لِلجِبال). العَرَبيّةُ تُرَمِّزُ المَعنى في شَكلِ ما يَفعَلُه الفَم؛ والصِّينيّةُ في شَكلِ ما تَرسُمُه اليَد. طَريقانِ، وَجهةٌ واحِدة: المَعنى يَسكُنُ في صورةِ العَلامةِ، لا يُسنَدُ إلَيها اعتِباطًا. التَّفصيلُ والمَراجِع: universal-baby-words.md.
The roster keeps growing, more cognates being confirmedالرُّوزنامةُ تَنمو، والمزيدُ مِنَ النَّظائر في طَريقه إلى التأكيد
Beyond the confirmed Tier-A entries, the pipeline holds 880+ Arabic ↔ Greek/Latin candidate pairs in active verification, and 11 have already been promoted to Tier-A across three rounds. These three are next in line: each already clears most of the four-bar rubric, and the column on the right shows the one piece of evidence that will lift it.
إلى جانِبِ نَظائرِ الصِّنف الأوّل المُؤَكَّدة، يَحمِلُ الأنبوبُ أَكثَرَ مِن 880 زَوجًا عَرَبيًّا ↔ يونانيًّا/لاتينيًّا قَيدَ التَّحَقُّق النَّشِط، وقد رُقِّيَ 11 مِنها إلى الصِّنف الأوّل عَبرَ ثَلاث جَولات. وهذه الثَّلاثةُ هي التالية في الصَّفّ: كُلٌّ مِنها يَجتازُ مُعظَمَ الضَّوابطِ الأربعة، والعَمودُ الأيمَنُ يُبَيِّنُ الشاهِدَ الواحِدَ الذي سيَرفَعُها.
| Arabic rootالجذر العربيّ | Proposed cognateالنَّظير المُقترَح | What lifts it to Tier-A nextما سيَرفَعُها إلى الصِّنف الأوّل |
|---|---|---|
| ك-ت-ب | type / Gr. κτύπος / stamp | Hebrew כתב is already solid, one clean Indo-European witness completes the dual-family barالعبريّة כתب راسِخةٌ بالفِعل، شاهِدٌ هندوأوربيٌّ نظيفٌ واحِدٌ يُكمِلُ ضابِطَ الفَصيلَتَين |
| خ-ل-ق | Lat. colere → colony, cult | Skeleton + recognition already pass; pinning the shared nucleus (create ↔ cultivate) closes itالهَيكلُ والإدراكُ يَجتازان؛ وتَثبيتُ النَّواةِ المُشتَركة (خَلق ↔ رِعاية) يُغلِقُها |
| ض-ح-و | Lat. dies / Eng. day / PIE *dyeu- | Indo-European side is very strong; one more Semitic attestation completes the bridgeالجانِبُ الهندوأوربيُّ قَويٌّ جِدًّا؛ وشاهِدٌ سامِيٌّ إضافيٌّ يُكمِلُ الجِسر |
Browse the full live candidate pool, both discovery and calibrated scores, in the interactive discoveries dashboard → تَصَفَّح حَوضَ المُرَشَّحاتِ الكامِلَ، بِنُقاطِ الاكتِشافِ والمُعايَرة، في لَوحةِ الاكتِشافاتِ التَّفاعُليّة ←
Why you can trust this roster, the four-bar bar in action لِماذا تَثِقُ بِهذه الرُّوزنامة، ضوابطُ التَّحَقُّقِ الأربعةُ في العَمَل
The confirmed roster is strong precisely because the bar is high. Surface resemblances that do not clear the consonant-skeleton bar are turned away and never enter the confirmed set, for example ع-ل-م ✗ signum (skeleton S-N vs ʿ-L-M), ق-ر-أ ✗ legere (Q-R vs L-G), ن-و-ر ✗ lumen (N-R vs L-M), and ي-ت-م ✗ yatīm (a historical loan from Arabic, not a parallel emergence). The full verification record, including every declined candidate, lives in tafsir-coran-tier-a-cognates.md. الرُّوزنامةُ المُؤَكَّدةُ قَويّةٌ تَحديدًا لأنّ المِعيارَ عالٍ. التَّشابُهاتُ السَّطحيّةُ التي لا تَجتازُ ضابِطَ الهَيكلِ الصَّامتيّ تُرَدُّ ولا تَدخُلُ المَجموعةَ المُؤَكَّدةَ أبَدًا، مِثل ع-ل-م ✗ signum، وق-ر-أ ✗ legere، ون-و-ر ✗ lumen، وي-ت-م ✗ yatīm (استِعارةٌ تاريخيّةٌ مِن العَرَبيّةِ لا بُروزٌ مُوازٍ). السِّجِلُّ الكامِلُ، بِكُلِّ مُرَشَّحٍ مَردود، في tafsir-coran-tier-a-cognates.md.
Who we're standing on
عَلى أَكتافِ مَن نَقِف
This is not a new idea, freshly invented. It is a thread that goes back twelve centuries, to al-Khalīl al-Farāhīdī's *Kitāb al-ʿAyn* and Ibn Jinnī's "the sounds of letters echo the shapes of their meanings." In the modern era, Dr Muhammad Hassan Jabal's *Etymological Dictionary* and Hassan Abbas's *Properties of the Arabic Letters* gave us the data and the sensory axis we test against. This study extends their work; it does not replace it.
ليسَت هذه فِكرةً جَديدةً اخْتُرِعَت اليَوم. هي خَيطٌ يَمتَدُّ اثنَي عَشَر قَرنًا، مِن «كتاب العين» لِلخَليل بن أَحمَد الفَراهيديّ، وَ«إمْساس الأَلفاظ أَشباهَ المَعاني» عند ابن جِنّي. وَفي عَصرِنا، أَعطانا «المُعجَم الاشتِقاقيّ المُؤَصَّل» لِلدكتور محمد حسن جَبَل، وَ«خصائص الحُروف العَرَبيّة ومَعانيها» لِحَسَن عَبّاس، البَياناتِ والمِحوَر الحِسّيَّ اللذَين نَختَبِرُ عَلَيهِما. هذه الدِّراسةُ تَمتَدُّ مِن عَمَلِهِم، لا تَحُلُّ مَحَلَّه.
From الخليل بن أحمد الفراهيدي (founder of Arabic linguistics, 8th c., Kitab al-Ayn) through ابن جنّي in al-Khasais (11th c., the إمساس الألفاظ أشباه المعاني doctrine on form-meaning correspondence), the classical lexicographers and grammarians worked out the architecture of root, derivation, and articulation that this study extends. See classical-survey-ar.md for the full survey.
من الخليل بن أحمد الفراهيديّ (مُؤسِّس اللغويّات العربيّة، القرن الثاني الهجريّ، «كتاب العين») إلى ابن جنّي في «الخصائص» (القرن الرابع، باب «إمساس الألفاظ أشباه المعاني» في تَلازُم الشكل بالمعنى)، وعُلَماء المعجم والنحو الكلاسيكيّين، وَضَعوا مِعمار الجذر والاشتقاق والنُّطق الذي تَمتدّ منه هذه الدراسة. انظر classical-survey-ar.md لِلمسح الكامل.
المعجم الاشتقاقي المؤصَّل, the canonical dataset every layer of this study tests against: 2,300 unique roots total (2,288 trilaterals + 12 quadri/quintilaterals), 2,285 trilaterals graded under the operative grammar to date, 453 binary nuclei, 1,666 Quranic applications. Jabal's compositional model (letter → binary → trilateral) is the structural skeleton; the study's new findings (universal dual-face, 11-mode native operative grammar + LOANWORD label) refine it against his own data.
«المعجم الاشتقاقيّ المُؤَصَّل»، المُدَوَّنة المَرجعيّة التي تَختبر كلُّ طبقةٍ في هذه الدراسة عليها: 2,300 جذرٍ فريد في المجموع (2,288 ثلاثيّ + 12 رُباعيٌّ وخُماسيّ)، و2,285 ثلاثيًّا قد تَمَّ تَصنيفُها تَحت نَحو العَمَل حتّى الآن، و453 نواةً ثنائيّة، و1,666 تَطبيقًا قرآنيًّا. نموذجُ جَبَل التركيبيّ (حرف ← نواة ← ثلاثيّ) هو الهيكل البنيويّ، والنتائج الجديدة لِلدراسة (قاعدةُ الوَجهَين العامّة، والأَبواب الأَحَدَ عَشَر الأَصيلة مع مَدخَل الدَّخيل) تُنَقِّحه على بياناته نفسها.
خصائص الحروف العربيّة ومعانيها (Arab Writers Union, 1998). Six sensory categories crossed with three evolutionary mechanisms (هيجانيّة / إيمائيّة / إيحائيّة). The framework absorbs his sensory axis and tests it across the full nucleus catalog.
«خصائص الحروف العربيّة ومعانيها» (اتّحاد الكتّاب العرب، 1998). ستّ فئاتٍ حِسّيّة مَضروبةٌ في ثلاث آليّاتٍ تَطَوُّريّة (هيجانيّة / إيمائيّة / إيحائيّة). تَستوعِب الدراسةُ محورَهُ الحِسّيّ وتَستقرئه على ديوان النوى الكامل.
What's done · what's next
ما أُنجِزَ · وما هو القادِم
The bottom-up core (letter → seed-meaning → trilateral root) is settled and tested. The cross-linguistic work is live and ongoing.
النَّواةُ الصاعِدةُ (حَرف ← بَذرة مَعنى ← جَذر ثُلاثيّ) مُستَقِرّةٌ ومُختَبَرة، والعَمَلُ بَينَ اللُّغاتِ حَيٌّ مُستَمِرّ.
✓ Settled✓ المُستَقِرّ
- COREThe core grammar. The unified 28-letter charge table with the dual-face rule, the full 453-nucleus catalogue, and eleven native composition modes (plus a LOANWORD label) reading all 2,285 trilateral roots at 100% native fit, now complete letter by letter.النَّحوُ الأساس. جَدولُ الحُروفِ الثَّمانِ والعِشرينَ المُوَحَّدُ بِقاعِدةِ الوَجهَين، وديوانُ النَّوى الـ453 كامِلًا، وأَحَدَ عَشَرَ بابًا أَصيلًا (مع مَدخَلِ الدَّخيل) تَقرَأُ الجُذورَ الـ2,285 بِمُطابَقةٍ تامّة، مُكتَمِلةً الآنَ حَرفًا حَرفًا.
- DUAL-FACEThe dual-face rule, stress-tested. Established by induction across all 453 nuclei and re-checked letter by letter, with the hollow letters (ا، و، ي) carrying active charges and a contradiction-check as a second pass.قاعدةُ الوَجهَين تَحتَ الضَّغط. ثابِتةٌ بِالاستِقراءِ على النَّوى الـ453 ومُراجَعةٌ حَرفًا حَرفًا، والجَوفيّاتُ (ا، و، ي) تَحمِلُ شَحَناتٍ فاعِلة، مع فَحصِ تَضادٍّ ثانٍ.
- Q-LOANThe Qur'anic loanword audit. All 27 words orientalists flagged as borrowings resolve as native, reverse-borrowed from Arabic, or jointly preserved with neighbours; none is a passive loan.مُراجَعةُ الدَّخيلِ القُرآنيّ. الكَلِماتُ الـ27 التي وَسَمَها المُستَشرِقونَ دَخيلًا تَنحَلّ أَصيلةً، أو مُستَعارةً عَكسيًّا مِنَ العَرَبيّة، أو مَحفوظةً مع الجِيران؛ لا واحِدةَ دَخيلٌ سَلبيّ.
- SCOPEHonest scope. Of 784 possible letter-pairs, 505 are attested, 139 phonotactically blocked, 140 true lexical gaps. And the grammar is Arabic-bound, not Qur'an-bound; it reads Jahili poetry and modern Arabic too.نِطاقٌ صَريح. مِن 784 زَوجًا مُمكِنًا: 505 مُثبَتة، و139 مَحجوبةٌ صوتيًّا، و140 فَجوةٌ مُعجَميّة. والنَّحوُ مَربوطٌ بِالعَرَبيّةِ لا بِالقُرآن؛ يَقرَأُ الشِّعرَ الجاهليَّ والعَرَبيّةَ الحَديثةَ أيضًا.
- TESTSGenerative and statistical tests. The framework predicted the meanings of unused letter-pairs before any lookup, then confirmed them in the classical lexicons; and letter-charges predict a root's composition mode at high significance.اختباراتٌ تَوليديّةٌ وإحصائيّة. تَنَبَّأَ الإطارُ بِمَعاني الأَزواجِ غيرِ المُستَعمَلةِ قَبلَ أيِّ بَحث، ثُمَّ أكَّدَها في المَعاجِمِ الكلاسيكيّة؛ وشَحَناتُ الحُروفِ تَتَنَبَّأُ بِبابِ التَّركيبِ بِدَلالةٍ عالية.
- TIER-ACross-linguistic verification. A four-bar rubric anchored in Khshim's sound-substitution laws, with 19 Qur'an-anchored Tier-A pairs; auditing those laws surfaced a tenth recurring correspondence (ط↔t).تَحَقُّقٌ بَينَ اللُّغات. ضوابطُ تَحَقُّقٍ أربعةٌ مُسنَدةٌ إلى قوانينِ خشيم لِلإبدالِ الصوتيّ، مع 19 زَوجًا راسخًا قُرآنيًّا؛ وتَدقيقُ تلكَ القوانينِ أَظهَرَ تَقابُلًا عاشِرًا مُتَكَرِّرًا (ط↔t).
- CROSS-IEThe cross-Indo-European signal. Eye-2 scored about 84,514 Arabic↔IE pairs across seven branches; after a calibrated blind re-scoring, 189 hold at ≥0.65 and the per-language correlations are statistically significant, so the signal is genuinely Indo-European, not Greek/Latin-bound. A 50-pair Tier-B reading list accompanies it.الإشارةُ بَينَ الفُروعِ الهندوأوربيّة. قَيَّمَ Eye-2 نَحوَ 84,514 زَوجًا عَبرَ سَبعةِ فُروع؛ وبَعدَ إعادةِ تَسجيلٍ مُعايَرٍ أعمى يَثبُتُ 189 عِندَ ≥0.65، والارتباطاتُ لِكُلِّ لُغةٍ دالّةٌ إحصائيًّا، فالإشارةُ هندوأوربيّةٌ حَقًّا لا مَقصورةٌ على اليونانيّةِ واللاتينيّة. ويُرافِقُها سِجِلُّ قراءةٍ مِن 50 زَوجًا.
- AFRO-ASIATICThe Afro-Asiatic and Semitic rosters. 200+ Arabic↔Ancient-Egyptian pairs at 55% top-tier with 30+ structural revelations, alongside the Hebrew, Aramaic, and oldest-sister Akkadian rosters. Browse it all in the interactive letter→root reader and discoveries dashboard.رَوزناماتُ الأَفروأَسيويّةِ والسامِيّة. أكثرُ مِن 200 زَوجٍ عَرَبيٍّ↔مِصريٍّ قَديم بِـ55% في الطَّبَقاتِ العُليا مع 30+ كَشفًا بِنيَويًّا، إلى جانِبِ رَوزناماتِ العِبريّةِ والآراميّةِ والأَكّاديّةِ (أَقدَمِ الأَخَوات). تَصَفَّحْها في قارئِ الحَرف←الجَذر ولَوحةِ الاكتِشافات.
⟳ In progress & next chapters⟳ قَيد العَمَل والفُصول القادِمة
- LV2+Quadriliteral & quintiliteral grammar. The catalogue is at 150 quadriliterals (145/150 native-readable), with the augment-letter table and mode-selection rule confirmed; all six pre-registered predictions pass.نَحوُ الرُّباعيّ والخُماسيّ. الكاتالوجُ عِندَ 150 رُباعيًّا (145/150 مَقروءٌ أَصيلًا)، مع تَأكيدِ جَدولِ الزَّوائدِ وقاعدةِ انتِخابِ الباب؛ وكُلُّ التَّنبُّؤاتِ السِّتّةِ المُسَجَّلةِ مُسبَقًا تَنجَح.
- PASS3Pass 3, an honest negative. 20 unused 4-letter skeletons were pre-registered with predicted meanings, then searched in Lisān and Tāj: 0 hits. So the framework is generative at the binary level but only interpretive at the quadriliteral level (it reads 145/150 real quadriliterals, yet cannot predict unused ones). The negative result bounds the claim honestly.Pass 3، نَفيٌ صادِق. سُجِّلَ مُسبَقًا 20 هَيكَلًا رُباعيًّا غيرَ مُستَعمَلٍ بِدَلالاتٍ مُتَوَقَّعة، ثُمَّ بُحِثَ في لِسانِ العَرَبِ وتاجِ العَروس: صِفرُ إصابات. فالإطارُ تَوليديٌّ على المُستَوى الثُّنائيّ لكنّه تَفسيريٌّ فَقَط على الرُّباعيّ (يَقرَأُ 145/150 رُباعيًّا حَقيقيًّا، لكنّه لا يَتَنَبَّأُ بِغيرِ المُستَعمَل). والنَّفيُ يَحُدُّ الادِّعاءَ بِصِدق.
- Independent second-rater pass on the 33 SELF-CANCELING and 16 COHERENT gap-pairs from the scaled generative test, plus inter-rater agreement on the operative-mode verdicts in the 2,285-trilateral corpus.مُراجَعةُ مُقَيِّمٍ مُستَقِلٍّ ثانٍ على الـ33 المُتَناقِضةَ-ذاتيًّا والـ16 المُتَّسِقة من اختبار التَّوليديّة المُوَسَّع، مع حِساب الاتِّفاق بَين المُقَيِّمَين على أَحكام الأَبواب في مُدَوَّنة الـ2,285.
- ✓ Done. All 2,285 binary-readings complete. The 302 weak-letter / hollow / hamzated nuclei flagged in the layer-2-partial-records audit are now filled from the fixed charges (anchored to Jabal's axial meanings); the corpus is at 100% letter-by-letter. Next: an independent second-rater pass.✓ تَمّ. كُلُّ القِراءاتِ الثُّنائيّةِ الـ2,285 مُكتَمِلة. النَّوى الـ302 (الجَوفاء والمَهموزة وذَواتُ الواوِ والياء) المَوسومةُ في مراجَعة السِّجِلّات الجُزئيّة أُكمِلَت مِنَ الشَّحَناتِ الثابِتة (مُسنَدةً إلى مَحاوِر جَبَل)؛ فالمُدَوَّنةُ الآنَ 100% حَرفيّة. التالي: مُراجَعةُ مُقَيِّمٍ ثانٍ مُستَقِلّ.
- Tier-B cross-linguistic expansion, 880+ Arabic↔Greek/Latin candidate cognates under refinement (11 promoted to Tier-A across three rounds).التَّوسُّع في الصِّنف الثاني بين اللغات، أَكثر من 880 مُرَشَّحًا (11 مُرَقَّى إلى الصِّنف الأَوّل عبر ثَلاث جَولات).
- Publish an English-language academic paper introducing the unified table, the dual-face rule, and the eleven native composition modes (plus the LOANWORD label).نَشرُ ورقةٍ أكاديميّةٍ بالإنجليزيّة تُقَدِّم الجدولَ المُوَحَّد، وقاعدةَ الوَجهَين العامّة، والأَبوابَ الأَحَدَ عَشَر الأَصيلة (مع مَدخَل الدَّخيل).
our-contributions-and-roadmap.md contains the full methodological detail for each line.
كلّ بَندٍ في الخارطة قائمٌ بِذاته وجاهزٌ لِلعمل المستقلّ. الورقة الموقفيّة في our-contributions-and-roadmap.md تَحوي التفصيل المنهجيّ الكامل لِكلّ سطر.
About & contact
عن الدراسة وللتواصل
تَمَسُّك للبحوث والنشر والتدريب
Temessek is the institutional home of this study and its sister works in Quranic linguistics. What you see on this page, the unified 28-letter table, the 453-nucleus catalog, the eleven native composition modes (plus the LOANWORD label), and the cross-linguistic verification rubric, is published, taught, and applied under the Temessek imprint.
تَمَسُّك هي البيتُ المؤسّسيّ لِهذه الدراسة وأعمالها الشقيقة في اللسانيّات القرآنيّة. ما يُعرَض على هذه الصفحة، جدولُ الحروف الثمانية والعشرين المُوَحَّد، وديوانُ الأربعمائة والثلاث والخمسين نواةً، وأبوابُ التركيب الاثنا عشر، وضوابطُ التحقّق بين اللغات، يُنشَر ويُدرَّس ويُطَبَّق تحت اسم تَمَسُّك.
Principal investigatorالباحث الرئيس
Public reading platformمنصّة القراءة العامّة
Computational side of the projectالجانب الحاسوبيّ من المشروع
Juthoor-Linguistic-GenealogyStatus & licenseالحالة والترخيص
How to read this study from a cold startكيف تقرأ هذه الدراسة من نقطة الصفر
- Start with the
README.mdfor the layout overview. - Read
our-contributions-and-roadmap.md, the shareable position paper. - Open
consensus-letter-charges.mdfor the canonical 28-letter table. - Browse
jabal-nuclei-extended.mdfor the full nucleus dossier. - See the framework applied to verses at coranisyours.com.
- ابدأ بِـ
README.mdلِفهم البنية العامّة. - اقرأ
our-contributions-and-roadmap.md، الورقة الموقفيّة القابلة لِلمشاركة. - افتح
consensus-letter-charges.mdلِلجدول المُوَحَّد لِلحروف الثمانية والعشرين. - تَصَفَّح
jabal-nuclei-extended.mdلِلديوان الكامل لِلنوى. - شاهد المَنظومة مُطَبَّقةً على الآيات في coranisyours.com.