Nature · Genome · Applicationالطبيعة · الجينوم · التطبيق

Juthoor

جُذُور

The Arabic Tongue: meaning, from letter to root

العربيّةُ: بِنيةُ المعنى من الحرفِ إلى الجذر

جَاعِلِ الْمَلَائِكَةِ رُسُلًا أُولِي أَجْنِحَةٍ مَثْنَىٰ وَثُلَاثَ وَرُبَاعَ
QURʾĀN · سورة فاطر · 35:1

Messengers, paired, threed, foured. The very architecture this study reads in every Arabic root: binary nuclei, trilateral roots, quadriliterals. And the word malāʾika (messengers) itself carries the consonant skeleton L-K, the same skeleton that builds kalām (speech, the message). In our Tier-A cross-linguistic roster (item #5 of 19), this L-K skeleton matches Latin clāmāre and English claim / clamor: a voice extended outward under constraint. A message is exactly that, speech sent forth within a binding form. الرُّسُلُ تَنزِلُ مَثنى وثُلاثَ ورُباع، وهي البِنيةُ ذاتُها التي تَقرأُها هذه الدراسةُ في كُلّ جَذرٍ عَربيّ: نَوًى ثُنائيّة، فجُذورٌ ثُلاثيّة، فرُباعيّات. وكَلِمةُ مَلائكة نَفسُها تَحمِلُ الهَيكلَ الصامتَ L-K (لام-كاف)، وهو الهَيكلُ ذاتُه الذي يَبني كَلام (القَولَ المُرسَل). وفي «الصِّنف الأَوّل» من سِجِلِّ المُشتَركات بَين اللُّغات، أي الجُذورِ الموثَّقةِ في هذه الدراسة، وعَدَدُها تِسعةَ عَشَر جَذرًا، يَحمِل المَدخَل الخامسُ هذا الهَيكلَ نَفسَه: عَربيّةُ ك-ل-م تُقابِل لاتينيّةَ clāmāre وإنجليزيّةَ claim / clamor، بمَعنى الصَّوتِ المَمدودِ تَحتَ قَيد. والرِّسالةُ هي ذلك بِعَينه: قَولٌ يُرسَلُ في صورةٍ مُحكَمة.

Arabic letters are not empty sounds. Each one carries a meaning-charge drawn from how the mouth makes it, and roots are built by combining those charges in eleven specific ways. This study tests that idea across the whole language, and follows its echoes into Hebrew, Egyptian, Greek, Latin and beyond.

حُروفُ العَرَبيّة ليسَت أَصواتًا فارِغة. كُلُّ حَرفٍ يَحمِل شَحنةَ مَعنىً مُستَمَدّةً مِن مَوضِع نُطقِه في الفَم، والجُذورُ تُبنى بِجَمعِ هذه الشَّحَنات في أَحَدَ عَشَرَ بابًا مُحَدَّدًا. تَختَبِر هذه الدِّراسةُ تلكَ الفِكرةَ عَبر اللُّغة كُلِّها، وتَتَتَبَّع أَصداءَها في العِبريّة والمِصريّة القَديمة واليونانيّة واللاتينيّة وغَيرها.

Conducted under تَمَسُّك للبحوث والنشر والتدريب · Temessek for Research, Publishing & Training تُجرى تحت تَمَسُّك للبحوث والنشر والتدريب

▸ What this project is, and why it matters▸ ما هذا المشروع، ولِماذا يَهُمّ What we discovered →ما اكتَشَفنا ← Try the root reader →جَرِّب قارئ الجَذر ←
28
Letters · dual-faceحرفًا · ازدواجيّة
453
Binary nucleiنواة ثنائيّة
2,285
Trilaterals gradedجذرًا مُصنَّفًا
11
Native modes (+1)بابًا أَصيلًا (+مَدخَل الدَّخيل)
100%
Native fitمطابقة أصليّة
200
Egyptian cognates · Afro-Asiaticنظيرًا مصريًّا · أفروأسيويّ
12c.
Of Arabic linguisticsقرنًا من اللغويّات
01 · Introductory note1 · ورقةٌ تَعريفيّة

What this project is, and why it matters

ما هذا المشروع، ولِماذا يَهُمّ

في أكثرِ اللُّغات، الحُروفُ رُموزٌ صَوتيّةٌ صِرفة، لا تَحمل في ذاتها مَعنىً، وإنّما تَتَشَكَّل المَعاني حين تُجمَع الحُروفُ في كَلِمات. أمّا العربيّةُ، فعَلى خِلاف ذلك. كلّ حرفٍ من حُروفها الثَّمانية والعِشرين يَحمل في ذاته شَحنةً دلاليّةً مَخصوصة، تَنبَع من شَكل نُطقه: حَركة اللسان، ومَوضع الصَّوت، وكيفيّة خُروج النَّفَس. ومَعنى كلّ كَلِمةٍ يُبنى تَركيبًا، حرفًا حرفًا، من مَعاني تلك الحَركات. الفِكرةُ بَسيطةٌ في ظاهِرها، لكنّها تُفضي إلى بِناءٍ كامل حين تُؤخَذ مَأخَذَ الجِدّ وتُختَبَر.

الفِكرةُ ليست جَديدة

صاغَها الخليلُ بن أحمد الفراهيديّ في «كتاب العين» قَبل اثني عشر قَرنًا، فرَتَّب المعجمَ كلَّه بِالمَخرَج، من أَقصى الحَلق إلى الشَّفَتَين. الفِكرة عنده أنّ الحَركة الفيزيائيّة لِلنُّطق هي مَنبَعُ الدِّلالة. وصاغَها ابنُ جنّي في «الخصائص» تَحت بابٍ سَمّاه «إمساس الألفاظ أشباه المعاني». ثمّ جاء ابنُ فارس في «مَقاييس اللغة» فأَعطى لِكلّ جذرٍ أَصلًا مَعنويًّا واحدًا. وفي عَصرنا، تَقومُ الأرضيّةُ المعجميّة على «المعجم الاشتقاقيّ المُؤَصَّل» لِلدكتور محمد حسن جَبَل، يَجاوره عَمَل حسن عبّاس على البَصَمات الحِسّيّة لِلحُروف.

ما تَفعله هذه الدراسة

أَخذنا هذا الحَدسَ القَديم لا كَمُسَلَّمةٍ بل كَفَرَضيّةٍ تَستَحقّ الاختبار، وأَجرَينا عليه فَحصًا منهجيًّا امتدّ سَنةً كاملة، قِراءةً قِراءةً، وحَرفًا حَرفًا، ونواةً نواة. واعتَمَدنا المُعجَمَ المَرجِعَ أَرضيّةً تَجريبيّة (28 حرفًا، و453 نواةً ثنائيّة، و2,285 جذرًا ثلاثيًّا)، فهو العَمودُ الفِقريّ لِلبَيانات في هذا الميدان. غير أنّنا لم نَنقُل قِراءاته كما هي. أَجرَينا قِراءاتنا بِاستقلال، فتَقاطَعَت مع المُعجَم في كثيرٍ من المَواضع، وامتَدَّت إلى ثَلاث نتائجَ بنيويّةٍ جَديدة على بِنية العربيّة الداخليّة:

  • جدولٌ مُوَحَّدٌ لِشَحَنات الحُروف الـ 28، فيه شَحنةٌ مَخرَجيّةٌ واحدةٌ حاكمةٌ لِكلّ حرف، مع وَصفٍ نُطقيٍّ ومُقابِلٍ إنجليزيٍّ موجَز.
  • قاعدةُ الوَجهَين العامّة: كلّ حرفٍ يَحمل وَجهَين دلاليَّين لِنُطقٍ واحد، والحرف الثالث في الجذر هو الذي يُحَدِّد أيَّ الوَجهَين يَعمل. ثَبَتَت بِالاستقراء على النَّوى الـ 453 كلِّها.
  • أحد عشر بابًا في تركيب الجذر الثلاثيّ (مع مَدخَلٍ ثاني عشر، الدَّخيل، يَلتَقِط الجذور غير الأصيلة، حالةٌ واحدةٌ من 2,285). النَّواةُ الثنائيّةُ تَعمل في الحرف الثالث وتَتَّخِذ شَحنتَهُ مادّةً لها، في أحد هذه الأبواب. تَنطبق على الجذور الـ 2,285 كلِّها انطباقًا تامًّا من غير تَكَلُّف. وهذه الأبواب أَنفُسها مَفتوحةٌ لِلتَّنقيح: قد تَتَّحِد بعضُها مع بَعض، وقد يَنشَقّ بعضُها إذا كَشَفَت بَياناتٌ جَديدة عن نَمَطٍ لم نَرَه.

ثُمَّ قادتنا هذه النَّتائج إلى سؤالٍ تالٍ: إذا كانت بِنيةُ النُّطق-المَعنى في العربيّة بهذه الشَّفافيّة، فهل أَثرُها يَظهر في الفصائل اللُّغَويّة الأُخرى؟ من هذا السؤال خَرَجَت نتيجةٌ رابعة، مُلحَقة بِالأَصل وقائمةٌ بِذاتها في الوَقت نَفسه:

  • ضوابطُ تَحَقُّقٍ مِن أربعةِ شُروط لِلنَّظائر بين اللغات، مُسنَدةٌ إلى قوانين الإبدال الصَّوتيّ التِّسعة عند د. علي فهمي خشيم، اجتازَتها ثَمانية أزواجٍ راسخةٍ قُرآنيًّا (كفء ↔ copy، سلام ↔ shalom، ربّ ↔ rabbi، جنّ ↔ genie، وغيرها). تَفصيلُها في القِسم المُخَصَّص لِما بين اللغات أَسفل هذه الصَّفحة.

السؤالُ الأَعمَق

هل العَلاقة بين أصوات الكَلِمة ومَعناها اعتباطٌ مَحض؟ أم في الأَمر بناءٌ مَخصوص؟ هذا سؤالٌ قَديم في الفلسفة الغَربيّة، طَرَحَه أَفلاطون في مُحاوَرة «كراتيلوس» قَبل ألفَين وأربعمائة عام، وحَسَمَه فيرديناند دي سوسير في مَطلع القَرن العِشرين بِالاعتباطيّة، فصارت أُسّ اللسانيّات الحديثة. غير أنّ كثيرًا من اللغويّين بَعده وَجَدوا في الإجابة قُصورًا. عَمِل إدوارد سابير ورومان ياكوبسون على الرَّمزيّة الصوتيّة. ووَضَع جون أوهالا ما سَمّاه «شِفرة التَّردُّد» التي تَربط الصَّوت الحادّ بِالصِّغر والثَّقيل بِالكِبَر. ووَسَّع جورج لايكوف هذا الباب نحو الإدراك المُجَسَّد. وفي السَّنوات الأخيرة، عَمِلَت أَسيفا مَجد على الحَواسّ في اللُّغة عبر الفصائل اللغويّة. لكنّ ما عند هؤلاء جَميعًا شَواهدُ مُتَناثِرة، لم تَبلُغ يَومًا الشُّمولَ المنهَجيَّ الذي تُتيحه العربيّة.

والتَّقليدُ العربيّ القَديم، قَبل سوسير باثني عشر قَرنًا، أَجاب الجَوابَ المُعاكِس صَريحًا: بِنيةُ المعنى مَوصولةٌ بِبِنية النُّطق. وهذه الدراسةُ تُقَدِّم أَوّل اختبارٍ تَجريبيٍّ مُنَهَّج وواسع لِدَعوى الاعتباطيّة، على لُغةٍ تَحمل بِنيةَ الجذر الشَّفّافة.

ولِذلك يَهُمّ هذا في خَمسة مَيادين

  • لِلدراسات العربيّة والقُرآنيّة: قراءاتٌ على مَستوى الآية، مُسنَدةٌ إلى عِلم المَخارج والصِّفات، لا إلى التَّقليد التَّفسيريّ وَحدَه.
  • لِعِلم اللُّغة العامّ: أَوّل اختبارٍ تَجريبيٍّ واسعٍ لِدَعوى الاعتباطيّة، على لُغةٍ بِبِنية جَذرٍ شَفّافة.
  • لِلسانيّات المُقارَنة: ضوابطُ تَحَقُّقٍ مُنضَبِطة تُمَيِّز النَّظائر الحَقيقيّة من التَّشابُهات السَّطحيّة.
  • لِلسانيّات الحاسوبيّة والذَّكاء الاصطناعيّ: جَبرٌ تَركيبيٌّ شَفّافٌ لِمعنى الجذر، لا تَبلُغُه نَماذجُ التَّضمين العَصَبيّة وَحدَها. اللُّغة على هذه القراءة رياضيّاتٌ صَوتيّةٌ وخوارزميّاتٌ مَعنويّة.
  • لِلتَّقليد العربيّ القَديم نَفسِه: ثِقةٌ مُجَدَّدة في ما بَدأه الخليلُ، بِأَدوات القَرن الحادي والعِشرين.
لِلتَّفصيل الكامل، انظر الورقة الموقفيّة، أو تابع الأقسام التالية في هذه الصَّفحة.

In most languages, letters are pure sound-tokens, arbitrary symbols that mean nothing on their own; meaning emerges only when they are assembled into words. Arabic does not work that way. Each of its 28 letters carries a specific semantic charge, drawn from the physical gesture of pronunciation itself: where the tongue sits, where the breath stops, where the sound is produced in the mouth. The meaning of every word is built compositionally, letter by letter, from the meanings of those gestures. The principle is simple at its root, but it opens a wide door when taken seriously and tested.

The idea is not new

Al-Khalil ibn Ahmad al-Farahidi shaped it in Kitab al-Ayn twelve centuries ago, ordering the entire dictionary by place of articulation, from deep in the throat forward to the lips. The principle for him was that the physical gesture of pronunciation is itself the wellspring of meaning. Ibn Jinni framed the same idea in al-Khasais under a chapter he called «إمساس الألفاظ أشباه المعاني»: letters touch upon resemblances of meanings. Ibn Faris in Maqayis al-Lugha assigned every Arabic root a single core semantic value. In our own era, the lexicographic foundation rests on Dr. Muhammad Hassan Jabal's al-Mu'jam al-Ishtiqaqi al-Mu'assal, alongside Hassan Abbas's parallel work on the sensory profiles of letters.

What this study does

We took the old intuition not as given but as a hypothesis worth testing, and put it through a year of systematic empirical examination, reading by reading, letter by letter, nucleus by nucleus. The reference lexicon (28 letters, 453 binary nuclei, 2,285 trilateral roots) served as the empirical backbone, the most complete dataset of its kind. We did not transcribe its readings, though. We conducted our examination independently, and our results converged with the corpus across much of what he had already established, then extended in three new structural directions on the internal architecture of Arabic itself:

  • A unified 28-letter charge table, with one ruling charge per letter, plus a phonetic note and an English gloss for every entry.
  • The general dual-face rule: every letter carries two semantic faces of the same physical articulation, and the third letter of a trilateral root selects which face is active. Established by induction across all 453 binary nuclei.
  • Eleven native composition modes for trilateral roots (with a twelfth label, LOANWORD, reserved for non-native borrowings, 1 case in 2,285). The binary nucleus operates on the third letter, taking its charge as material, in one of these closed modes. All 2,285 trilaterals fit, without forcing. The eleven modes themselves remain open to refinement: some may collapse together, others may split further, as new data reveals patterns we have not yet seen.

These three results then led us to a further question: if the articulation-meaning structure inside Arabic is this transparent, does it leave traces in other language families? That question produced a fourth result, related to the first three but standing on its own architecturally:

  • A four-bar verification rubric for cross-linguistic cognates, anchored by Dr. Ali Fahmi Khshim's nine sound-substitution laws, with eight Quran-anchored Tier-A pairs that pass it (kufu' ↔ copy, salām ↔ shalom, rabb ↔ rabbi, jinn ↔ genie, and others). The full development is in the cross-linguistic section below.

The deeper question

Is the link between the sounds of a word and its meaning entirely arbitrary, or is there a structure? The question is old in Western philosophy: Plato posed it in the Cratylus dialogue twenty-four centuries ago. Ferdinand de Saussure settled it at the beginning of the twentieth century with the principle of arbitrariness, which then became foundational for modern linguistics. Many later linguists, however, found the answer incomplete. Edward Sapir and Roman Jakobson worked on sound symbolism. John Ohala proposed the "frequency code" that ties high-pitched sounds to smallness and low-pitched sounds to size. George Lakoff opened the door to embodied cognition. In recent years Asifa Majid has worked on sensory linguistics across language families. Their evidence is suggestive, but scattered, and never reaches the systematic scale Arabic permits.

The classical Arabic tradition gave the opposite answer to Saussure twelve centuries before him, explicitly: meaning-structure is bound to articulation-structure. This study offers the first systematic, large-scale empirical test of the arbitrariness thesis, on a language whose root morphology remains transparent.

Why it matters, in five domains

  • Arabic and Quranic studies: verse-level readings grounded in the science of articulation, not in interpretive tradition alone.
  • General linguistics: the first systematic empirical test of the arbitrariness thesis at scale, on a language with transparent root morphology.
  • Comparative linguistics: a disciplined verification rubric that separates genuine cross-linguistic resonance from surface accident.
  • Computational linguistics and AI: a transparent compositional algebra for root-level meaning that neural embedding models cannot reach. On this reading, language is acoustic mathematics and semantic algorithms.
  • The classical Arabic tradition itself: a renewed standing for what al-Khalil began, now tested with the tools of the twenty-first century.
For the full development, see the position paper, or continue with the sections that follow on this page.
02 · What we discovered2 · ما اكتَشَفنا

Nine things this study has settled

تِسعةُ أَشياءَ حَسَمَتها هذه الدِّراسة

Arabic is not a list of words a culture happened to coin. It is a phonetic system that builds meaning from the way the mouth moves, and we can now show this empirically, on real data, with predictions made in advance. The same system shows up across distant languages, and shows up even more cleanly in Arabic's close family (Egyptian, Hebrew, Aramaic). And the Qur'an, when tested word by word, contains no borrowings. Each finding below links to the audit that backs it up.

العَرَبيّةُ ليسَت قائمةَ كَلِماتٍ سَكَّتها ثَقافةٌ صُدفةً. هي نِظامٌ صَوتيٌّ يَبني المَعنى مِن طَريقةِ حَرَكة الفَم، ويُمكِنُنا الآنَ إِثباتُ ذلك تَجريبيًّا، عَلى بَياناتٍ حَقيقيّة، بِتَنبُّؤاتٍ تُسَجَّل مُسبَقًا. النِّظامُ نَفسُه يَظهَرُ في لُغاتٍ بَعيدة، وَيَظهَرُ أَنظَفَ بَعد في أُسرةِ العَرَبيّةِ القَريبة (المِصريّة، العِبريّة، الآراميّة). وَالقُرآنُ، حِينَ يُختَبَرُ كَلِمةً كَلِمة، لا يَحوي دَخيلًا. كُلُّ نَتيجةٍ أَدناهُ مَوصولةٌ بِالتَّدقيقِ الذي يَدعَمُها.

1

Every Arabic letter carries meaning كُلُّ حَرفٍ عَرَبيٍّ يَحمِلُ مَعنى

Each letter carries a charge drawn from where the mouth makes it, not an empty sound. The bāʾ sticks. The rāʾ runs. The qāf cuts. The mīm gathers. And every letter has a soft face and a hard face, depending on its neighbours. This is the rule for all twenty-eight letters, with no exception.

كُلُّ حَرفٍ يَحمِلُ شَحنةً مُستَمَدّةً مِن مَوضِعِ نُطقِه، لا صَوتًا فارِغًا. الباءُ تُلصِق. الراءُ تَجري. القافُ تَقطَع. الميمُ تَجمَع. ولِكُلِّ حَرفٍ وَجهانِ، ناعِمٌ وخَشِن، حَسَب مُجاوِريه. هذه قاعدةُ الثَّمانية والعِشرين كُلِّها، بِلا استِثناء.

2

Two letters form a meaning-seed حَرفان يَصنَعانِ بِذرةَ مَعنى

When two letters meet, they make a binary nucleus. K + L = "the extending enclosure" (in kalām, kalb, kalima). J + M = "gathering into a mass" (in jamaʿ, jamāl, jamīʿ). The third letter joins and shapes how the seed acts, in one of eleven distinct ways. Eleven, not three, not twenty. These eleven cover every Arabic root without forcing.

عِندَما يَجتَمِعُ حَرفان، يَصنَعانِ نَواةً ثُنائيّةً. ك+ل = «الإحاطةُ المُمتَدّة» (في كَلام، كَلب، كَلِمة). ج+م = «الجَمعُ في كُتلة» (في جَمَع، جَمال، جَميع). الحَرفُ الثالِثُ يَنضَمّ فيُشَكِّل كَيف تَعمَلُ البِذرة في أَحَدِ أَحَدَ عَشَرَ بابًا. أَحَدَ عَشَرَ، لا ثَلاثة، لا عِشرون. هذه الأَحَدَ عَشَر تَكفي لِكُلِّ الجُذور العَرَبيّة بِلا تَكَلُّف.

3

Arabic and Indo-European share deep roots العَرَبيّةُ والهندوأوربيّةُ تَتَشاركانِ جُذورًا عَميقة

These are preserved conceptual families in the consonant skeleton, not late borrowings. Kalāmclamare / claim: the same voice-extended-under-constraint. Qarnhorn / corn (Welsh): the same hard sharp projection. SabtSabbath: across three Indo-European branches. The mainstream comparative philology missed this because it assumed Semitic and Indo-European were already separate when the parallels formed. They are not.

هي عائلاتٌ مَفاهيميّةٌ مَحفوظةٌ في الهَيكَلِ الصامِتيّ، لا استِعاراتٌ مُتَأَخِّرة. كَلام ↔ clamare/claim: نَفسُ الصَّوتِ المَمدودِ تَحت قَيد. قَرن ↔ horn / الوِلزيّة corn: نَفسُ النَّتوءِ الصُّلب الحادّ. سَبت ↔ Sabbath: عَبر ثَلاثةِ فُروعٍ هندوأوربيّة. الفيلولوجيا الغَربيّة المُقارِنة فاتَتها هذه الطَّبَقة لأَنّها افتَرَضَت أَنّ السامِيّةَ والهندوأوربيّةَ كانَتا مَفصولَتَين قَبل أَن تَتَكَوَّن هذه الجِنَاسات. ليسَتا كَذلك.

4

Every Qur'anic word is native Arabic, none of it borrowed كُلُّ كَلِمةٍ في القُرآنِ عَرَبيّةٌ أَصيلة، لا دَخيلَ فيها

Twenty-seven words flagged by orientalists as borrowings into Arabic (firdaws, qamīṣ, injīl, qalam, qirṭās, ṭāghūt, majūs, zanjabīl, and others) were re-read under our grammar, letter by letter. All twenty-seven (100%) resolve as native Arabic, or as reverse-borrowings from Arabic into the neighbour language, or as words preserved jointly with neighbours of the same era. The last two that resisted (majūs, zanjabīl) turned out to be morphological misreadings: majūs is a trilateral on وزن فَعول, zanjabīl a native compound (زَنّ + جُبَيل · "the small molded knob that emits a sharp zing") on the same pattern as Baalbek and Hadramawt. Centuries of "loanword" claims dissolve when each word is read under a disciplined native grammar.

سَبعةٌ وعِشرونَ كَلِمةً وَسَمَها المُستَشرِقونَ كَـدَخيلٍ في العَرَبيّة (فِردَوس، قَميص، إنجيل، قَلَم، قِرطاس، طاغوت، مَجوس، زَنجَبيل، وغَيرها) أُعيدَ قِراءَتُها تَحت نَحوِنا حَرفًا حَرفًا. السَّبعةُ والعِشرونَ كُلُّها (100%) تَنحَلّ إلى عَرَبيٍّ أَصيل، أَو إلى استِعارةٍ عَكسيّةٍ مِن العَرَبيّة، أَو إلى كَلِماتٍ مَحفوظةٍ بَينَها وَجِيرانِها في الحِقبة نَفسِها. الحالَتانِ اللَّتانِ قاوَمَتا (مَجوس، زَنجَبيل) تَبَيَّنَ أَنّ كِلتَيهِما خَطأُ قِراءةٍ صَرفيّة: مَجوس ثُلاثيٌّ على وَزن فَعول، وزَنجَبيل مُرَكَّبٌ أَصيل (زَنّ + جُبَيل · «النُّتوءُ الصَّغيرُ المَصبوبُ يَنفُذ مِنه وَخزٌ حادّ») على عَين نَمَط بَعلَبَك وحَضرَموت. قُرونٌ مِن دَعاوى «الدَّخيل» تَتَلاشى حين تُقرَأ كُلُّ كَلِمةٍ تَحتَ نَحوٍ أَصيلٍ مُنضَبِط.

5

The framework predicts meanings before we look, and the dictionaries confirm them الإطارُ يَتَنَبَّأُ بِالمَعنى قَبلَ أَن نَبحَث، والمَعاجِمُ تُؤَكِّد

We picked sixteen two-letter combinations Arabic seems not to use. Before checking any dictionary, the framework predicted what each would mean. Then we searched the deepest classical lexicons. Seven matched our predictions exactly: wakhz (the needle-prick we predicted for w·kh); dhaff (the sharp single-blow cleavage we predicted for dh·f); shadhdh (the deviation-by-piercing we predicted for sh·dh), and four others. The grammar produces real Arabic before anyone tells it.

اختَرنا سِتَّ عَشَرَ تَوليفةً مِن حَرفَين تَبدو غَير-مُستَعمَلةٍ في العَرَبيّة. وقَبلَ أَن نَنظُرَ في أَيِّ مُعجَم، تَنَبَّأَ الإطارُ بِما ستَعنيه كُلٌّ مِنها. ثُمَّ بَحَثنا في أَعمَقِ المَعاجِم الكلاسيكيّة. سَبعٌ طابَقَت تَنبُّؤاتِنا حَرفيًّا: وَخَز (الوَخزُ الذي تَنَبَّأنا بِه لِـ و·خ)؛ ذَفَّ (القَطعُ الحادُّ الذي تَنَبَّأنا بِه لِـ ذ·ف)؛ شَذَّ (الانفِصالُ بِتَخَلُّلٍ الذي تَنَبَّأنا بِه لِـ ش·ذ)، وأَربعٌ أُخرى. النَّحوُ يُنتِجُ عَرَبيّةً حَقيقيّةً قَبل أَن يَقولَها أَحَد.

6

A tenth correspondence beyond Khshim's nine, surfaced by the corpus قانونٌ عاشِرٌ وراءَ قَوانينِ خشيم التِّسعة، أَظهَرَتْهُ البَيانات

Dr. Ali Fahmi Khshim catalogued nine sound-substitution laws mapping Arabic letters to Indo-European ones (ك ↔ Q, ف ↔ P, ج ↔ G…). Running every confirmed cognate through them, one correspondence his list didn't include kept recurring: ط ↔ t, the emphatic ṭāʾ softening to a plain dental. It is the single most active pattern in the corpus (68 hits, the highest mean score of any). We don't claim it as new to linguistics: de-emphaticization is well known, and showcase words like ṣirāṭ (a Latin loan from strata) and qirṭās (Greek chartēs) are borrowings. The modest, exact result: the data surfaced a tenth recurring correspondence beyond the nine Khshim wrote down.

وَضَع الدكتور علي فهمي خشيم تِسعةَ قَوانينَ لِلإبدال الصَّوتيّ تُقابِلُ بِها حُروفُ العَرَبيّة حُروفَ الهندوأوربيّة (ك ↔ Q، ف ↔ P، ج ↔ G…). وبِتَطبيقِها على كُلِّ جِنَاسٍ مُؤَكَّد، تَكَرَّرَ تَقابُلٌ لم تَضُمَّه قائمتُه: ط ↔ t (تَلِينُ الطاءِ المُفَخَّمةِ إلى دَنتاليٍّ مُرَقَّق)، وهو أَنشَطُ نَمَطٍ في الكَوربَس كُلِّه (68 مَرّةً، أَعلى مُتَوَسِّطِ نُقطةٍ بَينَ كُلِّ الأَنماط). ولا نَدَّعيهِ جَديدًا على اللِّسانيّات: فَتَرقيقُ المُفَخَّماتِ مَعروف، وكَلِماتُ الاستِشهادِ مِثلُ صِراط (مُستَعارةٌ مِنَ اللاتينيّة strata) وقِرطاس (اليونانيّة chartēs) دَخيلة. النَّتيجةُ المُتَواضِعةُ الدَّقيقةُ هي هذه: أَظهَرَتِ البَياناتُ تَقابُلًا عاشِرًا مُتَكَرِّرًا وراءَ تِسعةِ خشيم.

7

Tested twice by two independent runs, and the strong findings held اختُبِرَ مَرَّتَين بِجَولَتَين مُستَقِلَّتَين، فصَمَدَ القَويّ

Every cognate finding was scored a first time, then re-scored independently by a second blind run applying the same calibrated rubric. Ninety percent of the strong findings survived the second pass. The findings the project headlines are not one rater's judgement; they are structures that two independent runs agree on. Where the second pass disagreed (mostly at the looser borderline), the dashboard shows both scores side by side rather than hiding the disagreement.

كُلُّ نَتيجةِ جِنَاسٍ سُجِّلَت أَوَّلًا، ثُمَّ أُعيد تَسجيلُها مُستَقِلًّا في جَولةٍ ثانيةٍ أَعمى بِنَفس الرُّبريك المُعايَر. تِسعونَ بالمِئة مِن النَّتائج القَويّة نَجَت إعادةَ التَّسجيل. النَّتائجُ التي يَتَصَدَّر بِها المَشروعُ ليسَت حُكمَ مُقَيِّمٍ واحِد؛ بَل بِنيَةٌ تَتَّفِق عَلَيها جَولَتانِ مُستَقِلَّتان. وحَيثُ اختَلَفَتِ الجَولةُ الثانية (في المَنطِقةِ الحَدّيّةِ غالبًا)، تَعرِضُ لَوحةُ الاكتِشافاتِ النُّقطَتَين جَنبًا إلى جَنبٍ بَدَلَ إخفاءِ الاختِلاف.

9

The framework didn't just match cognates, it revealed hidden ones الإطارُ لم يَكتَفِ بِتَأكيدِ الجِنَاسات، بَل كَشَفَ خَفِيَّها

The strongest evidence isn't the obvious matches; it's the cases where two words looked unrelated until the framework forced the alignment. Three classes surfaced from the 200-entry Afro-Asiatic audit: (1) Metathesis cognates. Arabic lisān (l-s-n) "tongue" looked unrelated to Egyptian ns (n-s) until Coptic ⲗⲁⲥ restored the ل, confirming a single root across letter-order swap. Same for أَنف (ʾ-n-f) ↔ fnḏ (f-n-ḏ). (2) Dual-face L3 swaps. رود/روض differ only at the third letter (د/ض, dental-emphatic family), and both read as the same path-stem under the framework's dual-face rule. (3) Polysemy as proof. Egyptian snt means "tooth, sister, second" all on one nucleus, because the framework's matched-pair-by-shared-fine-source seed delivers all three. None of these would surface from surface-comparison alone. They are real-world demonstrations of the framework's diagnostic power.

أَقوى الأَدِلّةِ ليسَت المُطابَقاتِ الواضِحة؛ بَل الحالاتُ التي بَدَت فيها كَلِمَتانِ غَيرَ مُتَّصِلَتَين حَتّى فَرَضَ الإطارُ المُحاذاة. ثَلاثُ فِئاتٍ سَطَعَت مِن تَدقيقِ الـ 200 مَدخَل الأَفروأَسيويّ: (1) جِنَاساتٌ بِقَلب المَواضِع. العَرَبيّةُ لِسان (ل-س-ن) بَدَت غَيرَ مُتَّصِلةٍ بِالمِصريّ ns (n-s) حَتّى استَعادَت القِبطيّةُ ⲗⲁⲥ اللامَ، فأَكَّدَت جَذرًا واحِدًا عَبرَ قَلب التَّرتيب. ومِثلُه أَنف ↔ fnḏ. (2) إبدالات وَجهَين عَلى L3. رود/روض يَختَلِفانِ في الحَرفِ الثالِثِ فَقَط (د/ض، عائلةُ الأَسنانِ المُفَخَّمة)، وَكِلاهُما يَقرَأ نَفسَ جَذرِ الطَّريق. (3) تَعَدُّدُ الدَّلالاتِ كَدَليل. المِصريّ snt يَعني «سِنّ، أُخت، ثانٍ» كُلَّها عَلى نَواةٍ واحِدة، لأَنّ بَذرة المُماثَلةِ بِالاشتِراكِ الدَّقيقِ تُعطي الثَّلاثةَ. لا واحِدةَ مِن هذه تَظهَر مِن المُقارَنةِ السَّطحيّةِ وَحدَها. هي بَراهينُ مُباشِرةٌ عَلى قُدرةِ الإطارِ التَّشخيصيّة.

8

The framework reads Ancient Egyptian unmodified, every word on the first try الإطارُ يَقرَأُ المِصريّةَ القَديمةَ دونَ تَعديل، كُلَّ كَلِمةٍ مِن أَوَّلِ مُحاوَلة

Arabic and Ancient Egyptian are close family: both Afro-Asiatic, both sharing an ancestor that predates the cuneiform records. We took 200 word-pairs spanning the full vocabulary spectrum (pronouns, body parts, kinship, motion verbs, action verbs, cognition, adjectives, nature, time, the sacred lexicon) and ran every one through the framework. 199 of 200 read coherently · top-three-tier hit-rate 55% and climbing (was 52%) (vs 25% for the distant Indo-European pool) · deep-family-core hit-rate 90%. The audit surfaced 30+ structural revelations, cases where the framework didn't just confirm a known cognate but revealed a hidden connection: metathesis cognates (لِسان ↔ ns, with Coptic ⲗⲁⲥ restoring the ل · أَنف ↔ fnḏ), dual-face L3 swaps (رود/روض · واسخ/واسع), and Egyptian polysemy as proof of shared seed (snt = tooth + sister + second on one nucleus · mwt = mother + die · ḥtp = rest + offering). The framework wasn't designed with Egyptian in mind; it just works, which is exactly what happens when a grammar documents something genuinely Afro-Asiatic rather than Arabic-specific.

العَرَبيّةُ والمِصريّةُ القَديمةُ أُسرةٌ قَريبة: كِلتاهُما أَفروأَسيويّة، كِلتاهُما تَتَشارَكانِ سَلَفًا أَقدَمَ مِن سِجِلّاتِ المِسماريّة. أَخَذنا 200 زَوجَ كَلِماتٍ تَشمَل طَيف المُفرَدات كُلَّه (الضَّمائر، أَجزاء الجَسَد، القَرابة، أَفعال الحَرَكة، أَفعال الفِعل، الإدراك، الصِّفات، الطَّبيعة، الزَّمَن، المُقَدَّس) وَأَدخَلناها كُلَّها في الإطار. 199 مِن 200 تُقرَأ بِتَماسُك · مُعَدَّلُ الإصابةِ في أَعلى ثَلاثة أَصناف 55% (كان 52%) (مُقابِل 25% في الحَوضِ الهندوأوربيّ البَعيد) · مُعَدَّلُ القَلبِ العَميقِ المُشتَرَك 90%. أَطلَعَ التَّدقيقُ 30+ كَشفًا بِنيَويًّا، حالاتٍ لم يَكتَفِ فيها الإطارُ بِتَأكيدِ جِنَاسٍ مَعروف، بَل كَشَفَ صِلةً مَخفيّة: جِنَاسات بِقَلب المَواضِع (لِسان ↔ ns، القِبطيّةُ ⲗⲁⲥ تَستَعيدُ اللام · أَنف ↔ fnḏ)، إبدالات وَجهَين عَلى L3 (رود/روض · واسخ/واسع)، وَتَعَدُّد دَلالات مِصريّة كَدَليل عَلى البَذرة المُشتَرَكة (snt = سِنّ + أُخت + ثانٍ عَلى نَواةٍ واحِدة · mwt = أُمّ + مات · ḥtp = راحة + قُربان). الإطارُ لم يُصاغ والمِصريّةُ في الذِّهن؛ وَمَع ذلكَ يَعمَل.

The next sections walk through the methodology, the findings, and the cross-linguistic results in technical detail. الأَقسامُ التالية تَمُرّ بِالمَنهَجيّةِ والنَّتائجِ وثِمارِ ما بَينَ اللُّغاتِ بِتَفصيلٍ تِقنيّ.

03 · How the framework works3 · كيف تعمل المَنظومة

How the framework works · letter → nucleus → root → word

كَيفَ تَعمَلُ المَنظومة · حَرف ← نَواة ← جَذر ← كَلِمة

An Arabic word is built like a small machine. Each letter is a part with a job. The first two letters click together into a seed-meaning. The third letter says how the seed acts: does it carry, hold, release, block, channel? The full word is one specific instance of that composed motion. This section shows the four layers of the stack, the five-step reading anyone can follow, and the dual-face rule that makes the whole system click.

الكَلِمةُ العَرَبيّةُ مَبنيّةٌ كَآلةٍ صَغيرة. كُلُّ حَرفٍ قِطعةٌ بِوَظيفة. الحَرفان الأَوّلان يَلتَقيان في بَذرة مَعنى. الحَرفُ الثّالِث يَقول كَيفَ تَعمَلُ البَذرة، هَل تَحمِل، تُمسِك، تُطلِق، تَحجُب، تُوَجِّه؟ والكَلِمةُ كاملةً تَجَلٍّ مَخصوصٌ لِتِلكَ الحَركة المُرَكَّبة. هذا القِسمُ يُري الطَّبَقات الأَربعَ، وَخُطُواتِ القِراءة الخَمسَ، وَقاعِدةَ الوَجهَين التي تُحرِّك المَنظومةَ كُلَّها.

The Juthoor stackطبقاتُ مشروع جُذُور (every layer is clickable)(كلّ طبقة قابلة للنقر)

Empirical corpus underneath: 2,300 unique roots in the canonical lexicon · 1,666 Quranic verses · the classical and modern scholarly sources frozen in Data raw/. المُدَوَّنة التَّجريبيّة تَحتها: 2,300 جذرٍ فريد في المُعجَم المَرجِع · 1,666 آيةً قرآنيّة · المصادر الكلاسيكيّة والحديثة المُجَمَّدة في Data raw/.

The five-step reading protocolبروتوكول القراءة من خمس خطوات

The universal dual-face structureقاعدةُ الوَجهَين العامّة

Empirical testing across all 453 binary nuclei in the canonical lexicon revealed a structural property that earlier scholarship had only suspected for a handful of letters: every Arabic letter carries two semantic faces of the same physical articulation. The trilateral family selects which face is active. This is one of the study's principal new findings. Per-letter stress test with 4–6 binary nuclei split between the two faces, and Quranic verse anchors, is in dual-face-stress-test.md.

كَشَفَ الاستقراءُ على الأربعمائة والثلاث والخمسين نواةً ثنائيّةً في المُعجَم خاصّيّةً لم يَستَكشِفْها مَن سَبَق إلّا في حروفٍ مَعدودة: كلّ حرفٍ عربيٍّ يَحمل وَجهَين دلاليَّين لِمَخرَجٍ نُطقيٍّ واحد، والحرف الثالث في الجذر هو الذي يُحدِّد أيّ الوَجهَين يَعمل. هذه إحدى النتائج الجديدة الرئيسة لِلدراسة. واختبارُ ضَغطٍ حَرفًا حَرفًا، بِأَربعِ إلى سِتِّ نَوًى ثُنائيّةٍ مَوزَّعةٍ على الوَجهَين مع مَراسٍ قُرآنيّة، في dual-face-stress-test-ar.md.

ن

Primary «انبِعاث رَنينيّ», outward resonant emission (نج, نف, نو).
Variant «رَنين مَحبوس», held cavity resonance (ثن, تن, طن). Same nasal articulation, two phases.

الوجه الأوّل «انبِعاث رَنينيّ»، رَنينٌ يَخرج إلى الخارج (نج، نف، نو).
الوجه الآخر «رَنين مَحبوس»، رَنينٌ مَحبوسٌ في تجويف (ثن، تن، طن). نُطقٌ أنفيٌّ واحد، وَجهانِ في مَرحَلتَين.

ج

Primary «تَجَمُّع في حَيِّز», gathering in a space.
Variant «بُروز من حَيِّز», surfacing out of a space (جَهْرًا, الْجِنّ). Same mid-palate burst, two semantic directions.

الوجه الأوّل «تَجَمُّع في حَيِّز»، اجتماعٌ داخل فَضاء.
الوجه الآخر «بُروز من حَيِّز»، خُروجٌ من فَضاء (جَهْرًا، الْجِنّ). انفجارٌ وَسَطيّ واحد، اتّجاهانِ دلاليّان.

ه

Primary «همس + تَنَفُّس», soft passing presence.
Variant «نَفَسٌ يَحمِل ويَتَلاشى», breath that carries off, dissipating. Same pure exhale, two roles.

الوجه الأوّل «همس + تَنَفُّس»، حُضورٌ ناعمٌ عابر.
الوجه الآخر «نَفَسٌ يَحمِل ويَتَلاشى»، نَفَسٌ يَحمل ثُمَّ يَنطَفئ. زَفيرٌ خالصٌ واحد، دَورانِ.

ب

Primary «اتّصال + تَمَسُّك», attachment that holds and reveals (gateway, opening to show).
Variant «انطِباق + إغلاق», sealed enclosure. Same lip closure, two faces.

الوجه الأوّل «اتّصال + تَمَسُّك»، التِصاقٌ يُمسِك ويُبدي (كَالباب يَجمع ويُظهر ما خَلفه).
الوجه الآخر «انطِباق + إغلاق»، إحكامُ الإغلاق. انطباقُ الشَّفَتَين نَفسُهُ، وَجهانِ.

The eleven native composition modes (+ LOANWORD label)الأَبوابُ الأَحَدَ عَشَر الأَصيلة (مع مَدخَل الدَّخيل)

The bottom-up path from letter to binary to trilateral is grounded by the study's second principal finding. Every Arabic trilateral root in the lexicon is interpretable as a single operative relation:

هذه النتيجةُ الثانية تُكمِل المسارَ الصاعد من الحرف إلى النَّواة إلى الجذر. كلُّ جذرٍ ثلاثيٍّ عربيٍّ في المُعجَم يَنحَلّ، من غير تَكَلُّف، إلى علاقة عَمَلٍ واحدة بين النَّواة الثنائيّة والحرف الثالث:

(binary nucleus) does X to (third letter's charge as material) النواةُ الثنائيّةُ تَعملُ في الحرف الثالث، وتَتَّخِذُ شَحنتَهُ مادّةً لها

…where this "operation" takes one of eleven native composition modes (with a twelfth label, LOANWORD, reserved for the 1-in-2,285 non-native root), finite and closed. 2,285 of 2,288 trilaterals graded (99.87%), all of them (100%) fall into a coherent mode without forcing. Caveat (kept close to the claim): every verdict comes from a single rater, and the model is descriptive rather than generative at this stage. All 2,285 records now carry a complete letter-by-letter binary reading, the final 302 weak-letter and defective-root nuclei (hollow / hamzated / و-ي roots) were completed from the fixed charges, anchored to Jabal's axial meanings. The focused Qur'anic loanword audit (27 worked cases from al-Suyūṭī's al-Itqān and Jeffery's catalog) finds that all 27 (100%) resolve as native, reverse-cognate, or convergent, none is a passive borrowing into Arabic. See lv2-operative-grammar.md for the full methodology and the interactive dashboard.

…و«العَمَل» هنا يَجري في أَحَدَ عَشَر بابًا أَصيلًا مَحدودةً مُغلَقة، مع مَدخَلٍ ثانٍ عشرَ، الدَّخيل، لِلجَذر غير الأَصيل (حالةٌ واحدةٌ من 2,285)، تَستوعِب الجذور كلَّها. اسْتُقرِئَ 2,285 جذرًا من أصل 2,288 (99.87%)، فاطَّرَدَت كلُّها (100%) على بابٍ مُتَّسقٍ من غير تَكَلُّف. تَنبيهٌ مَوصولٌ بِالدَّعوى: الحُكمُ في كُلّ جَذرٍ مِن مُقَيِّمٍ واحد، والنَّموذجُ وَصفيٌّ في هذه المَرحَلة لا تَوليديّ. وكُلُّ السِّجِلّات الـ 2,285 تَحمِلُ الآنَ قِراءةً حَرفيّةً ثُنائيّةً كامِلة، أُكمِلَتِ النَّوى الـ 302 الأَخيرةُ (الجُذورُ الجَوفاءُ والمَهموزةُ وذَواتُ الواوِ والياء) مِنَ الشَّحَناتِ الثابِتة، مُسنَدةً إلى مَحاوِرِ جَبَل المَعنَويّة. وَتَجِدُ المُراجَعةُ المُخَصَّصة لِلدَّخيل في القُرآن (27 حالةً مَدروسةً مِن «الإتقان» لِلسيوطيّ وكاتالوج جيفري) أَنّ الـ 27 كُلَّها (100%) تَنحَلّ إلى أَصيلٍ، أَو استِعارةٍ عَكسيّة، أَو تَلاقٍ مُستَقِلّ، لا واحِدةَ مِنها استِعارةٌ سَلبيّةٌ دَخَلَت العَرَبيّة. انظر lv2-operative-grammar.md لِلمَنهج الكامل، واللَّوحة التَّفاعُليّة.

The structural insightالمُلاحَظة الأصليّة

The binary nucleus is the agent; the third letter is the material the nucleus acts upon. Under this reading, قصر reads cleanly as "قص-cutting-precision BLOCKS the flow (ر)", a single coherent operation, like every other native trilateral in the corpus.

النَّواةُ الثنائيّةُ هي الفاعل، والحرف الثالث هو المادّة التي تَعمل فيها النَّواة. على هذه القراءة، يَنحَلّ قصر سَلِسًا: «قص القَطع الحاسم يَحجُب الجريانَ (ر)»، علاقةُ عَمَلٍ واحدةٌ مُتَّسقة، كَكلّ جذرٍ ثلاثيٍّ أصيلٍ في المُدَوَّنة.

The eleven native modes (plus the LOANWORD label), grouped by stanceالأَحَدَ عَشَرَ بابًا الأَصيلة (مع مَدخَل الدَّخيل)، مُجَمَّعةً بالوضع

Stanceالوضع Modeالنمط Meaningالمعنى Exampleمثال % of corpus% من المُدَوَّنة
POSITIVE 55.2%إيجاب 55.2%CARRYالحَمْلbinary carries L3-material forwardالنَّواةُ تَحمل مادّة الحرف الثالث وتُسَيِّرهاورد, و-bind carries د-fixity → arrivingورد: و-الرَّبط تَحمل د-الثَّبات ← الوُصول6.4%
HOLDالإمْساكbinary contains/encloses L3النَّواةُ تَحوي الحرفَ الثالث وتُمسكهبلد, بل-wet holds د-fixity → groundبلد: بل-الرُّطوبة تُمسك د-الثَّبات ← الأرضُ الثابتة16.3%
RELEASEالإطْلاقbinary lets L3-material burst outالنَّواةُ تُطلق مادّة الحرف الثالث وتُخرجهافتح, فت-loose releases ح-warmth → openingفتح: فت-الإرخاء تُطلق ح-الحرارة ← الانفتاح9.1%
PROJECTالإبْرازbinary extends L3 outward as featureالنَّواةُ تُبرز الحرفَ الثالث صِفةً ظاهرةحدد, ح-edge projects د-fixity → boundaryحدد: ح-الحَرف تُبرز د-الثَّبات ← الحَدّ11.7%
INTENSIFYالتَّضْعيفdoubled or amplified L3تَضعيفُ الحرف الثالث وتَكثيفُهجمد, ج-gather amplifies د-fixity → freezingجمد: ج-التَّجَمُّع تُضَعِّف د-الثَّبات ← التَّجَمُّد11.7%
NEGATIVE 11.5%سَلْب 11.5%BLOCKالحَجْبbinary stops/seals/walls off L3النَّواةُ تَحجب الحرفَ الثالث وتَسُدُّهسدد, س-flow blocked → sealing, stoppingسدد: س-الجَريان مَحجوبٌ ← السَّدّ والوَقف5.8%
DRAINالاسْتِنزافbinary gradually depletes L3النَّواةُ تَستنزف الحرفَ الثالث تَدريجًافقد, فق-void drains د-fixity → losingفقد: فق-الفَراغ تَستنزف د-الثَّبات ← الفَقد5.7%
TRANSFORM 33.3%تَحَوُّل 33.3%CHANNELالتَّوجيهbinary directs/shapes L3's pathالنَّواةُ تُوَجِّه الحرفَ الثالث وتَسوقُهجرى, جر-pull channels ى-flow → runningجرى: جر-الجَذب تُوَجِّه ى-الجَريان ← الجَري5.3%
OPERATEالإعْمالbinary modifies L3 via squeeze/fold/cutالنَّواةُ تَعمل في الحرف الثالث بِالضَّغط أو الطَّيّ أو القَطعحسم, حس-feel operates on م-mass → cuttingحسم: حس-اللَّمس تَعمل في م-الكُتلة ← القَطع24.4%
MIXالمَزْجblends the binary with L3النَّواةُ تَمتزج بالحرف الثالث وتَختلط بهروب, رو-going mixes ب-attach → curdled milkروب: رو-المَسير تَمتزج بـ ب-الالتِصاق ← الحَليب المُتَخَثِّر0.6%
REVERTالقَلْبcircles back / oscillates L3النَّواةُ تَردّ الحرفَ الثالث وتُعيدُهردد, ر-flow reverts د-fixity → returningردد: ر-الجَريان يَردّ د-الثَّبات ← العَودة2.9%
EXCEPTIONاستِثناءLOANWORDالدَّخيلnon-native compositionتركيبٌ غير أصيل، دَخيلٌ على العربيّة1 / 2,285 in current dataset1 من 2,285 في المُدَوَّنة الحاليّة0.0%

Predictive tests, all confirmedاختباراتٌ تَنبُّؤيّة، اطَّرَدَت كلُّها

A descriptive grammar can always be made to fit after the fact. What separates a real rule from after-the-fact fitting is whether it makes prediction in advance that the data then confirms. If the eleven native composition modes are real, then specific root shapes and specific letter-charge classes should cluster in specific modes, and they do.

النَّحوُ الوَصفيّ يُمكن أن يَتَكَيَّف مع البَيانات بَعد وُقوعها. الفَيصلُ بين القاعدة الحَقيقيّة والتَّكَيُّف اللاحق هو أن تُقَدِّم القاعدةُ تَنبُّؤًا سابقًا تُؤَكِّده البَيانات. إن كانت الأبواب الاثنا عشر صحيحةً، فإنّ أنماطًا مَخصوصةً من الجذور وحُروفًا مَخصوصةً من الشَّحَنات يَنبغي أن تَتَجَمَّع في أبوابٍ مَخصوصة. وهذا ما حَدَث:

Testالاختبار Predicted patternالتَّنبُّؤ Observedالمُلاحَظ
Doubled-final roots (XYY: بدد · ردد · جدد)الجُذور مُضَعَّفة الآخر (XYY: بدد · ردد · جدد)INTENSIFY + OPERATE dominateيَغلب التَّضعيف والإعمال66.9% of 405 roots ✓66.9% من 405 جذرًا ✓
Redoubled XY-XY roots (دردر · جمجم)الجُذور المُكَرَّرة XY-XY (دردر · جمجم)OPERATE + INTENSIFY dominateيَغلب الإعمال والتَّضعيف66.9% of 251 roots ✓66.9% من 251 جذرًا ✓
Letters with flow charge (ر · ل · ن · ع)الحروف ذات شَحنة الجَريان (ر · ل · ن · ع)Skew positive (CARRY · CHANNEL · PROJECT · RELEASE)تَميل إلى الإيجاب (الحَمل · التَّوجيه · الإبراز · الإطلاق)Confirmed ✓مُؤَكَّد ✓
Letters with mass charge (د · م · ق · ك · ص)الحروف ذات شَحنة الكُتلة (د · م · ق · ك · ص)OPERATE + HOLD dominateيَغلب الإعمال والإمساكConfirmed ✓مُؤَكَّد ✓

Scope of the result: why 453 / 505, not 784?نطاق النتيجة: لماذا 453/505 لا 784؟ honest framingعرضٌ صريح

A reader seeing "100% native fit" and "453 binary nuclei" will reasonably ask: what about the other pairs? With 28 letters, there are 28² = 784 mathematical possibilities for an L1·L2 binary. After folding hamza variants (أ/إ/آ/ء → ا) and alif-maqsura (ى → ي) onto the canonical alphabet, 505 unique binaries appear in at least one trilateral root in the lexicon (507 raw forms before fold; 453 are catalogued as standalone nuclei). Of the remaining 279 unattested pairs, the partition is honest and adds up:

القارئ الذي يَرى «100% انطباقٌ تامّ» و«453 نواةً ثنائيّة» سيَسأل بِحَقّ: ماذا عن الأزواج الباقية؟ بِالحُروف الثمانية والعشرين، هناك 28² = 784 إمكانيّةً حسابيّة لِزوج L1·L2. بِطَيِّ الهَمَزات (أ/إ/آ/ء ← ا) والألف المَقصورة (ى ← ي) إلى حُروف المُعجَم القَياسيّة، 505 نواةً فريدةً تَظهَر في جذرٍ ثلاثيّ في المُعجَم (507 صُوَر خامّ قَبل الطَّيّ، و453 منها مُدَوَّنةٌ في ديوان النَّوى المُستَقِلّ). أمّا الأَزواج الـ279 غير المُسَجَّلة، فالتَّقسيمُ صَريحٌ وحِسابُهُ يَنضَبط:

Filterالمُصَفّاة Pairs removedأزواجٌ مَحذوفة Linguistic reasonالسبب اللغويّ
alif-initialمَبدوءٌ بالألف (ا as L1, after hamza-fold)(ا في الموضع الأوّل بَعد طَيّ الهَمَزات) 7 The 7 ا-initial slots that even hamza variants didn't fill: اا · اض · اط · اظ · اع · اغ · اقالسَّبع الباقيات التي لم تَملأها أيّ صُورة هَمزيّة: اا · اض · اط · اظ · اع · اغ · اق
identical XXحرفان مُتطابقان (e.g. بب, دد, …)(مِثل بب، دد، …) 25 OCP (Obligatory Contour Principle), repeated consonants blocked (only هه and وو survive)قاعدةُ منع التَّماثُل في الصوامت في بداية الجذر (فقط هه و وو نَجتا)
same-articulator classحرفانِ من مَخرَجٍ واحد 107 Soft OCP, tongue-tip-twice (e.g. تد), lips-twice (e.g. بم) and similar adjacencies dispreferredقاعدةُ منع التَّماثُل المُخَفَّفة: طَرفُ اللسان مَرَّتَين (مثل تد)، أو الشَّفَتانِ مَرَّتَين (مثل بم)، وما أشبهها مَكروهٌ في الجَوار
Genuine lexical gapsفَجواتٌ مُعجميّةٌ حَقيقيّة 140 Phonologically allowed by Arabic but unused: the language could form them, but doesn'tيَسمح بها نظامُ أصوات العربيّة، لكنّها غيرُ مُستَعمَلة؛ كانت اللغة قادرةً على تَكوينها فلم تَفعَل

Math check: 505 attested + 139 phonotactically blocked + 140 lexical gaps = 784 ✓. The full per-L1 listing is auto-generated in layer-2-coverage-gap.md.

تحقّق حسابيّ: 505 نواةً مُسَجَّلة + 139 مَحجوبًا صوتيًّا + 140 فَجوةً مُعجميّة = 784 ✓. التَّفصيلُ الكامل في layer-2-coverage-gap.md المُوَلَّد آليًّا.

Phonotactically blockedمَحجوبٌ صوتيًّا-تركيبيًّا

139 pairs (50%) of the unattested set are blocked by known Arabic phonological constraints: alif as a vowel, OCP, articulator-class. These are not gaps; Arabic structurally cannot have them.

139 زوجًا (50%) من الأزواج غير المُستعمَلة محجوبةٌ بِقيودٍ صوتيّةٍ معروفةٍ في العربيّة: الألف كَصائت، مبدأ OCP، صنف المُخرَج. هذه ليست فجوات؛ فالعربيّةُ بِنيويًّا لا تَستطيع امتلاكها.

True lexical gapsفجواتٌ مُعجميّةٌ حَقيقيّة

Only 140 pairs (18% of all 784, or 50% of the 279 unattested) are pairs the language could have used but doesn't: the natural held-out test set for whether the operative model can become generative.

140 زوجًا فقط (18% من 784، أو 50% من الـ279 غير المُسَجَّلة) هي ما كان بِوُسع اللغة استعمالُها فلم تَستعمله؛ وهي مَجموعةُ الاختبار الطبيعيّة المُؤجَّلة لِقياس ما إذا كان نموذجُ التركيب يُمكن أن يَصير تَوليديًّا.

The honest claimالدَّعوى الصريحة

Every trilateral that exists in Arabic gets a coherent operative reading. We did not claim every theoretical XYZ would, and we name where the model's predictive reach is currently untested.

كلّ جذرٍ ثلاثيٍّ موجودٍ في العربيّة يَنحَلّ إلى قراءة عَمَلٍ مُتَّسقة. لم نَدَّعِ أنّ كلّ XYZ نظريٍّ سيَفعل، ونُسَمّي بِصراحةٍ المَوضعَ الذي لم يُختَبَر فيه مَدى التنبّؤ بَعدُ.

Why this mattersلماذا يَهُمّ هذا
The 100% native-fit claim is bounded by what Arabic actually uses, not by what's mathematically combinable. The bound is principled (phonotactic constraints attested independently in the linguistics literature) and explicit (we name and count the filter classes). The 140 lexical gaps are the project's natural next experiment: predict what each unused pair would mean. After the 8-pair pilot, the full L1-by-L1 scaled run on 155 candidate pairs (covering all 140 disjoint gaps plus 15 *-ا pairs treated as STRUCTURAL) finds 74.4% of the 129 non-structural gaps produce a coherent prediction (10.3% genuinely-unused COHERENT space + 51.6% OVERLAPPING with attested territory, lexical economy explains them), 21.3% are correctly screened as self-canceling, and the 16.8% alif-as-L2 cases are structural rather than lexical. دَعوى التوافق الأصيل بنسبة 100% مَحدودةٌ بما تَستعمله العربيّةُ فِعلًا، لا بما يَجمعه الرياضيّ. الحدّ مَبدئيّ وصريح. والـ140 فجوةً مُعجميّةً هي التجربة القادمة. بَعد التَّجرِبة التَّجريبيّة على 8 فَجوات، تَجِدُ التَّجرِبةُ المُوَسَّعةُ على 155 زَوجًا (تَشمل الـ140 فَجوةً المُنفَصِلة و15 زَوجًا *-ا مُعالَجةً كَ STRUCTURAL) أَنّ 74.4% من الـ129 فَجوةً غير-البِنيَويّة تُنتِجُ تَنبُّؤًا مُتَّسِقًا (10.3% فَضاءٌ مُتَّسِقٌ صَريحٌ غيرُ مُستَعمَل + 51.6% مُتَداخِلٌ مع نَواةٍ مُسَجَّلة)، و21.3% صَفّاها الإطارُ صَحيحًا كَ مُتَناقِض-ذاتيًّا، و16.8% بِنيَويّةٌ (ألف-كَ-L2).
04 · Empirical findings & ruling tables4 · النتائج والجداول الحاكمة

The reference tables

الجَداوِلُ المَرجِعيّة

Two tables do most of the work in this study. The first lists what each of the 28 Arabic letters *means*, its physical gesture and its semantic flavour. The second lists the 18 most active two-letter seeds, the ones that build the largest families of roots. Every line is traceable to a source.

جَدولانِ يَحمِلانِ مُعظَمَ الثِّقَل في هذه الدِّراسة. الأَوّلُ يَسرُد ما *يَعنيه* كُلُّ حَرفٍ مِنَ الـ 28، حَركَتُه الجَسَديّةُ وذَوقُه الدَّلاليّ. والثّاني يَسرُد الـ 18 بَذرَةَ ثُنائيّةٍ الأَكثَرَ نَشاطًا، تِلكَ التي تَبني أَكبَر العائلات الجِذريّة. كُلُّ سَطرٍ يَعودُ إلى مَصدَر.

The 28-letter unified charge tableجدولُ الحروف الثمانية والعشرين المُوَحَّد

One unified charge per letter, with phonetic note and English gloss. See consensus-letter-charges.md for the full file with variants section.

شَحنةٌ مُوَحَّدةٌ لِكلّ حرف، مع وَصفٍ نُطقيٍّ ومُقابلٍ إنجليزيّ. انظر consensus-letter-charges.md لِلمَلفّ الكامل مع قِسم الفُروق.

حرف Unified chargeالشَّحنة المُوَحَّدة Phonetic noteإشارة صوتيّة English glossالمُقابل الإنجليزيّ
ءتَأكيد + قَطعsharp glottal onset, breath stopped at the throatوَقفٌ حَنجَريٌّ حادّ، النَّفَس مَوقوفٌ عند الحَلقsharp affirmation, beginning
اامتداد صائتbreath standing open, prolongedنَفَسٌ مَفتوحٌ مَمدودextension, sustained presence
باتّصال + تَمَسُّكlips press and release, closing-then-opening sealالشَّفَتانِ تَنطَبقانِ ثُمَّ تَنفَتِحان، إغلاقٌ يَتبَعُه فَتحattachment, holding, gateway
تامتداد لطيف + تَمامtongue tip touches upper teeth, light percussionطَرفُ اللسان يَلمُس الأسنانَ العُليا، قَرعٌ خَفيفgentle extension to completion
ثتَناثُر + تَفَتُّتtongue between teeth, fine breathy spreadاللسانُ بين الأسنانِ، انتشارٌ نَفَسيٌّ دَقيقscattering, small-grained spread
جتَجَمُّع في حَيِّزmid-palate stop with an emerging burstوَقفةٌ وَسَطُ الحَنَكِ مع بَزْغgathering in a space, surfacing
ححياةٌ حارّة + احتواءdeep throat friction, warm breath enclosedاحتِكاكٌ عَميقٌ في الحَلق، نَفَسٌ دافئٌ مَحبوسliving warmth that contains
ختَخَلخُل + اختِراقscratchy back-of-throat frictionاحتِكاكٌ خَلفَ الحَلق، خَشِنٌ جافّrarefying, piercing through
دضَبط + ثَباتtongue behind teeth, firm closed nudgeاللسانُ خَلفَ الأسنان، دَفعةٌ مُغلَقةٌ حازِمةfixity, grounding, settled push
ذنَفاذ + حِدَّةtongue between teeth with voiceاللسانُ بين الأسنانِ بِصَوتٍ مَجهورpiercing from inside, fine bringing-out
رتَكرار + جَريانtongue tip rolls against alveolar ridgeطَرفُ اللسان يَرتَجِف على غارِ الحَنَكrepetition, running, flow
زاندفاع + اهتزازsharp voiced sibilant from the frontصَفيرٌ حادٌّ مَجهور من المُقَدَّمthrust with vibration, sharp penetration
سامتداد + سَيَلانbreathy sibilant gliding forwardصَفيرٌ مَهموسٌ يَنزَلِق إلى الأمامextending flow, fine streaming
شانتشار + تَفَرُّقwide breathy spread from the front of the mouthانتشارٌ نَفَسيٌّ واسعٌ من مُقَدَّم الفمbranching, scattering outward
صصَلابة + إطباقemphatic sibilant from a tight palateصَفيرٌ مُطبَقٌ من حَنَكٍ مَشدودhardness, sealed strength
ضضَمّ + ثِقَلemphatic voiced lateral, tongue presses heavyجانبيٌّ مَجهورٌ مُطبَق، اللسانُ يَضغَط بِثِقَلdrawing-together with weight
طانبساط + انتشار ثَقيلemphatic dental, heavy spreading touchأسنانيٌّ مُطبَق، لَمسةٌ ثَقيلةٌ مُنتَشِرةbroad heavy spreading
ظبُروز + حِدّةemphatic interdentalبين-أسنانيٌّ مُطبَقpronounced surfacing, edged prominence
عقَبضٌ حَلقيٌّ + شِدّةdeep guttural pharyngeal gripقَبضةٌ حَلقيّةٌ عَميقةdepth-grip, intense from the throat
غغَور يَسترback-of-throat fricativeاحتِكاكٌ خَلفَ الحَلقconcealing depth, covering
فتَفريق + نَفاذbreath escapes between lip and upper teethالنَّفَسُ يَخرج بين الشَّفة السُّفلى والأسنان العُلياparting through, splitting open
ققَطع + إحكامback-of-palate stop, firm releaseوَقفةٌ خَلفَ الحَنَك، إفراجٌ حازمcutting precision, firm settling
ككَتم + قَطعunvoiced back-of-palate stopوَقفةٌ مَهموسةٌ خَلفَ الحَنَكpressed closure, sealed cut
لتَعَلُّق + امتِدادtongue against alveolar ridge, voiced glideاللسانُ على غارِ الحَنَك، انزِلاقٌ مَجهورattachment that extends, a bridge
متَجمُّع + تَلاصُقlips closing, breath gatheredالشَّفَتانِ تَنغَلِقانِ، النَّفَس مَجموعgathering, sealing into a mass
نرَنين + انبِعاثnasal resonance from insideرَنينٌ أنفيٌّ من الباطنinner resonance emitted outward
ههمس + تَنَفُّسsoft exhale from the throatزَفيرٌ ناعمٌ من الحَلقbreath, soft passing
ووَصل + ربطrounded lips, sustained connectorالشَّفَتانِ مُدَوَّرَتان، وَصلٌ مَمدودbinding, joining, sustained link
يامتداد + لِين + سَريانfront of palate, voiced glideمُقَدَّمُ الحَنَك، انزِلاقٌ مَجهورgentle directed extension

The 18-nucleus working setالمجموعة العاملة، ثماني عشرة نواة

A curated subset of the 453 binary nuclei, the highest-frequency, Quran-anchored seeds. The full 453 catalog with charge-only and TC-anchored dossiers is in 03-scholar-extracts/jabal-nuclei-*.md.

مُختارَةٌ من النوى الثنائيّة (453 نواة)، أعلاها تَردُّدًا وأقواها رُسوخًا في القرآن. الديوانُ الكامل لِلنوى، مع المَلفّات المَشحونة فحسب والمَلفّات الراسخة في تفسير قرآن، مَوجودٌ في 03-scholar-extracts/jabal-nuclei-*.md.

Nucleusالنواة Meaningالمعنى Examplesأمثلة
الextending attachment, intimate bondتَعَلُّقٌ مُمتدّ، صِلةٌ حَميمةأَلِفَ، إِلْف، آلاء
برmanifest extension, surfacing-and-runningامتدادٌ ظاهر، بُروزٌ وجَريانبَرَّ، بَرَزَ، بَرَأَ
بدmanifest fixing, surface-staysثَباتٌ ظاهر، ظُهورٌ يَستَقِرّبَدَأ، بَدَا، بَدَّلَ
حمliving containment, warm enclosureاحتواءٌ حَيّ، إحاطةٌ دافِئةحَمَى، حَمَلَ، حَمِدَ، رَحِم
حقliving precision, contained truthإحكامٌ حَيّ، حَقيقةٌ مُحاطةحَقّ، حَقَّقَ، حَقيقة
ربrepeating attachment, holding-and-multiplyingتَعَلُّقٌ مُتَكَرِّر، إمساكٌ وتَكثيررَبّى، رَبا، تَربية
رحrepeating warmth, recurring containmentدِفءٌ مُتَكَرِّر، احتواءٌ مُتَجَدِّدرَحِم، رَحْمَة، راحة
سلflowing attachment, fine slidingتَعَلُّقٌ جارٍ، انزِلاقٌ لَطيفسَلَّمَ، سَلَكَ، سَلِمَ
سمextending-toward-completion, liftingامتدادٌ نحو التَّمام، ارتِفاعسَمَا، اسم، سَموّ
علdepth-grip extendingقَبضٌ عَميقٌ يَمتدّعَلِمَ، عَلَا، عِلم، عالَم
فرparting-then-runningتَفريقٌ ثُمّ جَريانفَرَّ، فَرَقَ، فَرَدَ
فطparting-then-spreadingتَفريقٌ ثُمّ انتِشارفَطَرَ، فِطرة
قرprecision repeating, firm settlingإحكامٌ مُتَكَرِّر، اسْتِقرارٌ ثابِتقَرَأ، قَرَّ، قَرارَ
كلsealed extension, pressed-attachmentامتدادٌ مَختوم، تَعَلُّقٌ مَضغوطكَلَّ، كُلّ، كَلِمة
ملكgathering-and-sealing-at-a-cutجَمعٌ وإحكامٌ عِند القَطعمَلَك، مُلْك، مَليك
نجinner resonance gatheringرَنينٌ داخليٌّ يَجتمعنَجا، نَجم
هدbreath-fixingنَفَسٌ يَستَقِرّهَدى، هَدَأ
وصbinding-with-emphatic-strengthرَبطٌ بِشِدّةٍ مُطبَقةوَصَلَ، وَصَى، وَصْف
05 · Cross-linguistic layer5 · طبقةُ ما بين اللغات

Words that echo across languages

كَلِماتٌ يَتَرَدَّدُ صَداها بين اللُّغات

Try saying كَلام (kalām) and "claim" out loud. Or قَول (qawl) and "call." Or جَنّ (jinn) and "genie." The match isn't accidental: the same human mouth, faced with the same human meaning, shapes the same sound. This section catalogues that echo, and the discipline we use to tell a real one from a coincidence.

قُل كَلام و claim بِصَوتٍ عالٍ. أَو قَول و call. أَو جِنّ و genie. التَّوافُقُ ليسَ صُدفة، الفَمُ البَشَريّ نَفسُه، أَمامَ المَعنى البَشَريّ نَفسِه، يُشَكِّلُ الصَّوتَ نَفسَه. هذا القِسمُ يُكَتلِجُ ذلك الصَّدى، والمَنهَجُ الذي نُمَيِّزُ بِه الحَقيقيَّ مِنَ المُصادَفة.

د. علي فهمي خشيم
Dr. Ali Fahmi Khshim (1936–2011)
cross-linguistic anchorالأرضيّة اللغويّة المُقارِنة

President of the Libyan Arabic Language Academy, member of the Cairo Arabic Language Academy, PhD in philosophy (Durham, 1971). Author of رِحلة الكلمات (Journey of Words, 1986 / 1998), the modern Arabic-language reference for comparative work between Arabic and other language families. Khshim's nine sound-substitution laws govern the consonantal correspondences that the rubric below depends on.

رئيس مَجمع اللغة العربيّة اللّيبيّ، وعضو مَجمع اللغة العربيّة بالقاهرة، دكتوراه في الفلسفة (دَرَم، 1971). صاحب «رِحلة الكلمات» (1986 / 1998)، المرجع العربيّ الحديث في العمل المُقارِن بين العربيّة وسائر العائلات اللغويّة. قوانينُ الإبدال الصوتيّ التِّسعة عند خشيم تَحكُم التَّقابُلات الصامتيّة التي يَعتمد عليها المعيار التالي.

The four-bar verification rubricضوابطُ التحقّق الأربعة

A pair earns Tier-A status only if it clears all four bars: consonant skeleton match (via Khshim's sound-substitution laws) · nucleus identity (the binary semantic seed survives the crossing) · modern reader-recognition · dual-family confirmation (Semitic and Indo-European traces). See tafsir-coran-tier-a-cognates.md for the full Tier-B ledger and the anti-patterns.

Applied in reverse · the Quranic loanword auditتطبيقٌ مَعكوس · مراجَعةُ الدَّخيل في القرآن

The same four-bar rubric, applied in reverse, asks the harder question: do the centuries-old "loanword" claims about Qur'anic words actually survive scrutiny? We worked all 27 cases listed in al-Suyūṭī's al-Itqān and Arthur Jeffery's catalog through the framework. The result: all 27 (100%) resolve as native Arabic compositions, reverse-borrowings from Arabic, or convergent emergence: none is a passive borrowing into Arabic. The two cases that long resisted both turned out to be morphological misreadings: مَجوس is a trilateral م-ج-س on وزن فَعول (the augment-و is not a root letter), and زنجبيل is a native compound زَنّ + جُبَيل · "the small molded knob that emits a sharp zing", exactly the pattern of بَعلَبَك and حَضرَموت. What looked for centuries like proof of foreign vocabulary in the Qur'an dissolves when each word is read letter-by-letter under a disciplined native grammar. Full evidence and per-word readings: quranic-loanword-audit.md.

تُطَبَّقُ الضَّوابطُ الأَربعةُ نَفسُها في الاتّجاه المُعاكِس، وَتَطرَح السُّؤالَ الأَصعَب: هَل تَنجو دَعاوى «الدَّخيل» القَرنيّةُ في الكَلِمات القُرآنيّة مِن الفَحصِ فِعلًا؟ دَرَسنا الـ 27 حالةً كُلَّها كَما أَوْرَدَتها «الإتقان» لِلسيوطيّ وكاتالوج آرثر جيفري عَبر الإطار. النَّتيجة: السَّبعةُ والعِشرونَ كُلُّها (100%) تَنحَلّ إلى تَركيباتٍ عَرَبيّةٍ أَصيلة، أَو استِعاراتٍ عَكسيّةٍ مِنَ العَرَبيّة، أَو تَلاقٍ مُستَقِلّ، لا واحِدةَ مِنها استِعارةٌ سَلبيّةٌ دَخَلَت العَرَبيّة. الحالَتانِ اللَّتانِ قاوَمَتا طَويلًا تَبَيَّنَ أَنّ كِلتَيهِما خَطأُ قِراءةٍ صَرفيّة: مَجوس ثُلاثيٌّ م-ج-س عَلى وَزن فَعول (الواو ليسَت حَرفَ جَذر)، وَزنجَبيل مُرَكَّبٌ عَرَبيٌّ أَصيلٌ مِن زَنّ + جُبَيل · «النُّتوءُ الصَّغيرُ المَصبوبُ يَنفُذ مِنه وَخزٌ حادّ»، عَلى عَين نَمَط بَعلَبَك وحَضرَموت. ما بَدا قُرونًا دَليلًا عَلى مُفرَداتٍ أَجنبيّةٍ في القُرآنِ يَتَلاشى حِين تُقرَأ كُلُّ كَلِمةٍ حَرفًا حَرفًا تَحتَ نَحوٍ أَصيلٍ مُنضَبِط. التَّفصيلُ الكامل: quranic-loanword-audit-ar.md.

لا يَرقى زَوجٌ إلى الصِّنف الأوّل إلّا إذا اجتاز الضوابطَ الأربعة مُجتَمعةً: تَطابُقُ الأصول الحَرفيّة (عَبر قوانين الإبدال الصوتيّ عند خشيم) · اتّحادُ النَّواة (البَذرة الدلاليّة الثنائيّة تَنجو في العُبور بين اللغتَين) · إدراكُ القارئ المُعاصِر · شاهدٌ من فَصيلتَين ساميّةٍ وهندوأوروبيّة. انظر tafsir-coran-tier-a-cognates.md لِسجلّ الصِّنف الثاني الكامل والأنماط المُضادّة.

The 19 Tier-A cross-linguistic cognatesالنَّظائر التِّسعة عَشَر بين اللغات، الصنف الأوّل

Arabic rootالجذر العربيّ Cognateالنَّظير Skeletonالهيكل Shared nucleusالنواة المُشتَركة Home verseآية المرجع
ك-ف-ءcopy / copie / כפל (Heb)K-Fthe second-instance that lines up against the firstالمِثلُ الذي يُحاذي الأصل112:4
س-ل-مshalom (Heb) / shalmā (Aram)S-L-Mbound completeness, peace-as-wholenessالتَّمامُ المَربوط، السَّلامُ بِمَعنى الكَمال97:5
ر-ب-بrabbi / rav (Heb)R-Bthe expansive holder, master-by-nurtureالمُمسِكُ المُوَسِّع، السَّيِّدُ بِالتَّربية1:2
ج-ن-نgenie / genusG-Nborn-from-a-hidden-source, kin-bearing concealmentالمَولودُ من أصلٍ خَفيّ، اِستِتارٌ يَحمل نَسبًا114:6
ك-ل-مclaim / clamor (Lat. clamare)K-L-Mutter-with-intent, the spoken claim that landsالقَولُ بِقَصد، الدَّعوى المَلفوظة تَبلُغ2:75
ق-و-لcall (PIE *kel-)K/Q-Lthe summon-uttered, the audible-reachالنِّداء المَلفوظ، البُلوغُ المَسموع112:1
ش-ر-بsorb / absorb / syrupS-R-Bthe take-in of fluid, absorbing-flowتَلَقِّي السَّائل، امتصاصُ الجَريان2:60
ج-م-عGemini / gemellusG-M / J-Mgathered-into-pair, together-as-oneمَجموعانِ في قِران، الاثنَين كَواحد2:148

Tier-A · The Semitic siblings, Arabic ↔ Hebrew + Aramaic (the unity baseline)الصِّنفُ الأَوّل · الأَخَواتُ الساميّة، العَرَبيّة ↔ العِبريّة + الآراميّة (خَطُّ الأَساس)

Read this honestly: the siblings are the baseline, not the proofاقرَأها بِصِدق: الأَخَواتُ خَطُّ الأَساس، لا الدَّليل

Hebrew and Aramaic are not a test of the framework; they are the same Semitic tongue as Arabic, split by regular rule not long ago. Of course they share قَلب/heart and مَوت/death: that is common descent, which plain comparative Semitics already explains. So we do not claim the sibling numbers (Hebrew 84%, Aramaic 97% top-tier) as evidence for the letter-charge thesis. They are the unity baseline, expected, and high by construction. The framework's real evidence lies elsewhere: (1) within Arabic itself, reading meaning out of the letter-gestures across 2,285 roots; (2) the phenomenological why the siblings never give, comparative Semitics says "death is a shared root," the framework says why that sound means death (the gathering-sealing-completion gesture), the full reading of the deepest shared roots is here; and (3) the reach beyond the siblings, into Egyptian (a 6,000-year split) and Indo-European (a separate family on the standard tree), where shared vocabulary is not obvious. The gradient across the branches, siblings ~90%, super-family ~56%, the most distant branches lower, is not a signal fading into noise; it is a preservation gradient: how much of the original tongue's sound-meaning logic each branch kept. Arabic kept it most intact; the further a branch eroded, the more scattered its surviving traces, but where a trace survives, read through the fixed charges, it still composes to the same meaning. That convergence of meaning across branches long drifted apart is what points back to one original tongue, the original Arabic. The four-bar rubric is the honesty filter that keeps genuine traces and turns away forced look-alikes, not a rule that distance equals doubt.

العِبريّةُ والآراميّةُ ليسَتا اختبارًا لِلإطار، هُما نَفسُ اللِّسانِ الساميِّ مَع العَرَبيّة، انقَسَمَ بِقاعِدةٍ مُنتَظِمةٍ مُنذُ زَمَنٍ غَيرِ بَعيد. بِالطَّبعِ تَتَشارَكُ القَلبَ والمَوتَ: ذلكَ أَصلٌ مُشتَرَك تُفَسِّرُه اللِّسانياتُ السامِيّةُ المُقارَنةُ أَصلًا. لِذا لا نَدَّعي أَرقامَ الأَخَوات (العِبريّة 84٪، الآراميّة 97٪) دَليلًا عَلى أَطروحةِ شَحَنات الحُروف. هي خَطُّ أَساسِ الوَحدة، مُتَوَقَّعٌ، عالٍ بِالبِنية. دَليلُ الإطارِ الحَقيقيُّ في غَيرِ ذلك: (1) داخِلَ العَرَبيّةِ نَفسِها، قِراءةُ المَعنى مِن حَرَكاتِ الحُروفِ عَبرَ 2,285 جَذرًا؛ (2) تَفسيرُ لِماذا، وهو ما لا تُعطيه الأَخَوات: المُقارَنةُ تَقول «المَوتُ جَذرٌ مُشتَرَك»، والإطارُ يَقول لِماذا يَعني ذلكَ الصَّوتُ المَوتَ (حَركةُ التَّجَمُّعِ-الخَتمِ-التَّمام)، القِراءةُ الكامِلةُ لِأَعمَقِ الجُذورِ المُشتَرَكة هُنا؛ (3) الوُصولُ أَبعَدَ مِنَ الأَخَوات، إلى المِصريّة (انقِسامٌ عُمرُه 6,000 سَنة) والهندوأوربيّة، حَيثُ المُفرَداتُ المُشتَرَكةُ ليسَت بَدَهيّة. التَّدَرُّجُ عَبرَ الفُروع، الأَخَوات ~90٪، الأُسرةُ الكُبرى ~56٪، والفُروعُ الأَبعَدُ أَدنى، ليسَ إشارةً تَتَلاشى في ضَجيج؛ بَل هو تَدَرُّجُ حِفظ: كَم حَفِظَ كُلُّ فَرعٍ مِن مَنطِقِ النُّطق-المَعنى لِلِّسانِ الأَصليّ. العَرَبيّةُ حَفِظَتهُ أَتَمَّ حِفظ، وكُلَّما تآكَلَ الفَرعُ تَبَعثَرَت آثارُه الباقِية، لَكِن حَيثُ يَبقى أَثَرٌ، يُقرَأُ عَبرَ الشَّحَناتِ الثابِتة، فإنّه لا يَزالُ يُرَكِّبُ المَعنى نَفسَه. وهذا التِقاءُ المَعنى عَبرَ فُروعٍ تَباعَدَت طَويلًا هو ما يَدُلُّ على لِسانٍ أصليٍّ واحِد، العَربيّةِ الأولى. والضَّوابطُ الأربعةُ مِصفاةُ صِدقٍ تُبقي الأَثَرَ الحَقيقيَّ وتَرُدُّ التَّشابُهَ المُفتَعَل، لا قاعِدةٌ تَجعَلُ البُعدَ شَكًّا.

Arabic ↔ Hebrew, 219 entries, 84% top-tier (117 PERFECT). The PERFECT share alone (53%) dwarfs Egyptian's 4%. Whole fields come over intact: the numbers 1–1000, the body, kinship, the sacred lexicon (نَبيّ↔navi, كاهِن↔kohen, قُدُس↔qadosh). It also closes the لِسان metathesis: Hebrew lashon keeps the ل, completing the Coptic / Hebrew / Arabic triple-witness. roster · data.

العَرَبيّة ↔ العِبريّة، 219 مَدخَلًا، 84٪ في أَعلى ثَلاثة أَصناف (117 تامّ). نِسبةُ التامّ (53٪) تَفوقُ المِصريّةَ (4٪) بِأضعاف. حُقولٌ كامِلةٌ تَعبُر سالِمة: الأَعداد 1–1000، الجَسَد، القَرابة، المُعجَمُ المُقَدَّس. الرُّوزنامة · البَيانات.

Arabic ↔ Aramaic, 96 entries, 97% top-tier (62 PERFECT). Aramaic completes the trio and shows the one-tongue divergence happening by rule: أرض→arʿā (ḍ→ʿ), ذهب→dahab (ḏ→d), ثلاث→tlāt (ṯ→t), سلام→shlama (s↔š). The regularity of the shifts is itself the signature of a single language diverging, not a scatter of coincidences. data.

العَرَبيّة ↔ الآراميّة، 96 مَدخَلًا، 97٪ في أَعلى ثَلاثة أَصناف (62 تامّ). الآراميّةُ تُكمِلُ الثُّلاثيَّ وتُري انقِسامَ اللِّسانِ الواحِدِ يَجري بِقاعِدة: أرض→arʿā، ذهب→dahab، ثلاث→tlāt، سلام→shlama. انتِظامُ الإبدالاتِ نَفسُه هو تَوقيعُ لُغةٍ واحِدةٍ تَتَشَعَّب، لا مُصادَفاتٌ مُبَعثَرة. البَيانات.

Arabic ↔ Akkadian, 75 entries, 93% top-tier (24 PERFECT). Akkadian is the oldest attested Semitic, the earliest written sister of Arabic (~2500 BCE), so it pushes the unity baseline back two millennia. Its signature is the loss of the gutturals (بَعل baʿl → bēlu lord · عَين ʿayn → īnu eye · أَرض ʾarḍ → erṣetu earth) alongside the regular interdental shifts (ثَلاث → šalāš, أُذُن → uznu, اسم → šumu). Whole core fields cross intact, the body, kinship, the numbers, the pronouns (أنا↔anāku, أنتَ↔atta). Five honest parallel-stems (king↔šarru, son↔māru) are kept low, not forced. That a sister this old still reads this cleanly through the same fixed charges deepens the trace of the one original source. data.

العَرَبيّة ↔ الأَكّاديّة، 75 مَدخَلًا، 93٪ في أَعلى الأَصناف (24 تامّ). الأَكّاديّةُ أَقدَمُ ساميّةٍ مُدَوَّنة، أَوّلُ أَخَواتِ العَرَبيّةِ كِتابةً (~2500 ق.م)، فتَدفَعُ خَطَّ أَساسِ الوَحدةِ أَلفَي عامٍ إلى الوَراء. تَوقيعُها سُقوطُ الحُروفِ الحَلقيّة (بَعل → bēlu رَبّ · عَين → īnu · أَرض → erṣetu) مع الإبدالاتِ المُنتَظِمة (ثَلاث → šalāš، أُذُن → uznu، اسم → šumu). حُقولٌ جَوهَريّةٌ كامِلةٌ تَعبُرُ سالِمة، الجَسَد، القَرابة، الأَعداد، الضَّمائر (أنا↔anāku). وخَمسةُ جُذورٍ مُوازِيةٍ صادِقة (مَلِك↔šarru، ابن↔māru) تُبقى مُنخَفِضةً بِلا افتِعال. وأنْ تُقرَأَ أُختٌ بِهذا القِدَمِ بهذا الوُضوحِ عَبرَ نَفسِ الشَّحَناتِ الثابِتةِ يُعَمِّقُ أَثَرَ المَصدَرِ الأصليِّ الواحِد. البَيانات.

العِبريّةُ أَقرَبُ إلى العَرَبيّة مِن المِصريّةِ القَديمة، فَهُما تَتَشارَكانِ الوالِدَ الساميَّ المُباشِر. وَتَنبُّؤُ الإطارِ بِالمَسافةِ الأُسَريّةِ يَقول إنّ العِبريّةَ يَنبَغي أَن تُقرَأ أَنظَفَ بَعدُ مِن المِصريّة، وَالرُّوزنامةُ الآنَ بِـ219 مَدخَلًا تُؤَكِّدُ ذلك بِحَسم: 117 تامّ (نَفسُ الجَذرِ بِلا إبدال) + 4 بِدائيّةٌ أُسَريّة + 64 قَويّ (إبدالٌ ساميٌّ مُنتَظِم مِثل ث↔š، ض↔ts، ذ↔z) = 185 / 219 في الطَّبَقاتِ العُليا (84٪). نِسبةُ التامّ وَحدَها (53٪) تَفوقُ المِصريّةَ (4٪) بِأضعاف. حُقولٌ دَلاليّةٌ كامِلةٌ تَعبُر سالِمة، الأَعداد 1–1000، الجَسَد، القَرابة، المُعجَمُ المُقَدَّس (نَبيّ↔נָבִיא، كاهِن↔כֹּהֵן، قُدُس↔קָדוֹשׁ، سَجَد↔סָגַד). التَّدَرُّج، العِبريّة 84٪، المِصريّة ~56٪، الهندوأوربيّة المُعايَرة 25٪، مُثَبَّتٌ الآنَ عِند ثَلاثِ نِقاطٍ في الاتّجاهِ المُتَوَقَّع. التَّفصيل: tier-a-hebrew-cognates.md · البَيانات: hebrew-cognates.json.

Tier-A · Afro-Asiatic · Arabic ↔ Ancient Egyptian (200-entry close-family roster)الصِّنفُ الأَوّل · الأَفروأَسيويّة · العَرَبيّة ↔ المِصريّة القَديمة (روزنامةُ الأُسرةِ القَريبة · 200 مَدخَلًا)

The Indo-European roster above tests the framework against distant relatives of Arabic. The framework's deeper prediction is that resonance should be cleanest where the family tie is closest, and Arabic's closest family is Afro-Asiatic (Egyptian, Hebrew, Aramaic, Berber, Ge'ez). This roster of 324 Arabic ↔ Ancient-Egyptian pairs (and growing) reads under the same operative grammar without forcing across the full vocabulary spectrum: 11 PERFECT (same root, no shifts) + 7 PROTO-AFRO-ASIATIC (family-shared pronouns and particles) + 1 DUAL-FACE PAIR + 78 STRONG (predictable articulator-class shifts) + 18 PARTIAL + 84 PROVISIONAL. Top-three-tier hit-rate: 179 / 324 = 55% (was 52%, and still climbing), twice the calibrated distant-IE rate. Deep-family-core hit-rate (the 20 most-shared family-wide words like eye, mother, water, die, soul, the pronouns): 90%. The audit surfaces 30+ structural revelations the framework brought to the surface, metathesis cognates like لِسان ↔ ns (Coptic ⲗⲁⲥ restores the ل), dual-face L3 swaps like رود/روض, polysemy as evidence of shared seed (Egyptian snt = tooth + sister + second on one nucleus), and articulator-class shifts that align hidden semantics (حَيّ ↔ ʿnḫ, جانِب ↔ gs, سَمِع ↔ sḏm). Full per-word readings: tier-a-afro-asiatic-cognates.md.

الرُّوزنامةُ الهندوأوربيّةُ أَعلاهُ تَختَبِرُ الإطارَ في مُواجَهةِ أَقرِباءَ *بَعيدين* لِلعَرَبيّة. وَالتَّنَبُّؤُ الأَعمَقُ لِلإطار أَنّ الصَّدى يَنبَغي أَن يَكون أَنظَفَ حَيثُ الرَّوابِطُ الأُسَريّةُ أَقرَب، وَأَقرَبُ أُسرةٍ لِلعَرَبيّةِ هي الأَفروأَسيويّة (المِصريّة، العِبريّة، الآراميّة، الأَمازيغيّة، الجِعزيّة). هذه الرُّوزنامةُ بِـ324 زَوجًا عَرَبيًّا ↔ مِصريًّا قَديمًا (وفي نُمُوّ) تَقرَأ تَحتَ نَفسِ النَّحوِ العَمَليّ بِلا افتِعال عَبرَ طَيف المُفرَدات كُلِّه: 11 تامّ + 7 بِدائيّةٌ أَفروأَسيويّة + 1 زَوجٌ ذو وَجهَين + 78 قَويّ + 18 جُزئيّ + 84 مُؤَقَّت. مُعَدَّلُ الإصابةِ في أَعلى ثَلاثة أَصناف: 179 / 324 = 55% (كان 52%، وفي صُعود)، ضِعفُ ما في الحَوضِ الهندوأوربيّ المُعايَر. وَفي القَلبِ العَميقِ المُشتَرَك (الـ 20 كَلِمة الأَكثَر اشتِراكًا أُسَريًّا، عَين، أُمّ، ماء، مات، نَفس، الضَّمائر): 90%. أَطلَعَ التَّدقيقُ 30+ كَشفًا بِنيَويًّا، جِنَاسات بِقَلب المَواضِع مِثل لِسان ↔ ns (القِبطيّةُ ⲗⲁⲥ تَستَعيدُ اللام)، وَإبدالات وَجهَين عَلى L3 مِثل رود/روض، وَتَعَدُّد دَلالات كَدَليل عَلى البَذرة المُشتَرَكة (المِصريّ snt = سِنّ + أُخت + ثانٍ عَلى نَواةٍ واحِدة)، وَإبدالات صَوتيّة تُحاذي دَلالاتٍ مَخفيّة (حَيّ ↔ ʿnḫ، جانِب ↔ gs، سَمِع ↔ sḏm). التَّفاصيل: tier-a-afro-asiatic-cognates-ar.md.

Egyptianالمِصريّ Arabic cognateالنَّظيرُ العَرَبيّ Form classالتَّصنيفُ الشَّكليّ Shared seed-meaningبَذرةُ المَعنى المُشتَرَكة Verdictالحُكم
سخسخ sḫsḫسَخَّ · "running"reduplicated XYXYمُكَرَّر XYXYسخ: sliding-flow piercing forward, doubledسخ: انزِلاقٌ خَرّاقٌ مُضَعَّفPERFECT
دي dyذا / ذي · "here, this"bare binaryثُنائيٌّ عارٍدي: settled-point gently pointed-toدي: نُقطةٌ مَضبوطةٌ يُشارُ إلَيها بِلَطفPROTO-FAMILY
واسخ wsḫواسِع · "wide"prefixed trilateralثُلاثيٌّ بِبادِئةو+سخ: bound extension piercing outward to widthو+سخ: امتدادٌ مَربوطٌ يَختَرِقُ إلى السَّعةDUAL-FACE PAIR
جعجع jʿjʿجَعْجَعَ · "dazzled"reduplicated XYXYمُكَرَّر XYXYجع: intense gathering surging from depth-grip, doubledجع: تَدَفُّقٌ مُفاجِئٌ مِن قَبضةِ عُمق، مُضَعَّفSTRONG
بطط bṭṭبَطَّ / بَطَحَ · "flatten"geminate XYYمُضَعَّف XYYبط: sealed attachment + heavy spreading-pressureبط: التِصاقٌ مَختومٌ + ضَغطٌ ناشِرٌ ثَقيلSTRONG
مقير mqyrمَقهور · "miserable"trilateral on مَفعيلثُلاثيّ عَلى مَفعيلمق: bound-down mass with thin trickleمق: كَتلةٌ مَكبوتةٌ مَع خَيطٍ رَفيعSTRONG
رود/روض rwd/rwḏرَوْد / رَوْض · "stairway road"trilateral · dual-face on L3 (د/ض)ثُلاثيّ · وَجهانِ عَلى L3 (د/ض)رو: walked binding settling / cleared-open spreadرو: رَبطٌ مَطروقٌ مُستَقِرّ / انبِساطٌ مَفتوحٌ مُسَوّىPERFECT
وبان wbnبان / أَبان · "appear"prefixed bare-binaryثُنائيٌّ بِبادِئةبن: what was sealed-inside released into outward resonanceبن: ما خُتِم في الباطِنِ يَنطَلِقُ رَنينًا إلى الخارِجPERFECT
خم ḫmخَمَّ / خامَ · "callout / cheat"bare binaryثُنائيٌّ عارٍخم: piercing into the sealed-massخم: اختِراقٌ في المَجموعِ المَختومSTRONG
بس bsبس / بَسَّ · "if only"bare binary (particle)ثُنائيٌّ (أَداة)بس: bound-passage letting only a thin stream throughبس: مَمَرٌّ مَربوطٌ يُمَرِّر تَيّارًا رَفيعًا فَقَطSTRONG
جسر jsrجِسر · "clear road / bridge"trilateralثُلاثيّجسر: gathered crossing-space extending and runningجسر: حَيِّزُ عُبورٍ يَمتَدُّ ويَجريPERFECT
عَين ʿnعَين · "eye, source, spring"bare binary · cross-family universalثُنائيّ · كَونيُّ الأُسرةعن: intense grip from depth that emanates outwardعن: قَبضٌ عَميقٌ يُشِعّPERFECT
سَمير smrسَمير · "companion, courtier"trilateral · exact 3-consonant matchثُلاثيّ · تَطابُقٌ كامِلسمر: streaming-gathering that runs togetherسمر: السَّيَلانُ المَجموعُ يَجري مَعًاPERFECT
مات mwtمات · "die"trilateral · universal Afro-Asiaticثُلاثيّ · كَونيٌّ أَفروأَسيويّمو: gathered-sealed mass binds to final completionمو: التَّجَمُّعُ المَختومُ يَنعَقِدُ نِهايةPERFECT
أُمّ mwtأُمّ · "mother"geminate / trilateral · universalمُضَعَّف / ثُلاثيّ · كَونيّمم: the gathered originating sourceمم: المَصدَرُ الأَوّليُّ المَجموعPERFECT
ماء mwماء · "water"bare binary · universalثُنائيّ · كَونيّمو: bound-gathering, sealed-yet-flowing massمو: الكَتلةُ المَختومةُ السَّيّالةPERFECT
جاء jyجاء · "come, arrive"bare binaryثُنائيّ عارٍجي: gathered-surfacing extending gently forwardجي: البُروزُ يَمتَدُّ لَطيفًا أَمامَهPERFECT
شَفة sptشَفة · "lip"trilateral · ش↔s sibilant shiftثُلاثيّ · إبدالٌ صَفيريّشف: front-spreading that parts to release breathشف: الانتِشارُ الأَماميُّ يَنفَرِجُ لِيُطلِقَ النَّفَسSTRONG
لِسان nsلِسان · "tongue"metathesis cognateجِنَاسٌ بِقَلبسن: fine flow resonating from inside · Coptic ⲗⲁⲥ restores the لسن: السَّيَلانُ الرَّفيعُ يَرِنّ · القِبطيّةُ تَستَعيدُ اللامSTRONG
جانِب gsجانِب · "side, half"trilateral · ج↔g (Khshim L3)ثُلاثيّ · ج↔gجن/gs: gathered-surface extending from the central bodyجن: سَطحٌ مَجموعٌ يَمتَدُّ مِن الجَسَدِ المَركَزيّSTRONG
حَيّ ʿnḫحَيّ · "alive, life"trilateral · ح↔ʿ (Khshim L6)ثُلاثيّ · ح↔ʿحي: warm grip from depth projecting outwardحي: قَبضٌ حَيٌّ مِن العُمقِ يُشِعُّ خارِجًاSTRONG
سَمِع sḏmسَمِع · "hear, obey"trilateral · ع↔ḏ cross-familyثُلاثيّ · ع↔ḏسم: extending stream that gathers/pierces inwardسم: السَّيَلانُ يَتَجَمَّعُ وَيَنفُذُ داخِلًاSTRONG
نَحنُ jn-nنَحنُ · "we"Proto-Afro-Asiatic pronoun stemضَميرٌ بِدائيٌّ أَفروأَسيويّن: shared inner resonance, the inside-groupن: الرَّنينُ الداخِليُّ المُشتَرَك، المَجموعةُ الداخِليّةPROTO-FAMILY
مِن mمِن · "from, in, with"single-letter preposition · universalحَرفُ جَرٍّ مُفرَد · كَونيّم: relational gathering-marker, the all-purpose prepositionم: مارِكَرُ التَّجَمُّعِ العَلاقيّ، حَرفُ الجَرّ الجامِعPROTO-FAMILY
أَنف fnḏأَنف · "nose" 🔑trilateral · metathesis (ʾ-n-f ↔ f-n-ḏ)ثُلاثيّ · جِنَاسٌ بِقَلبنف/fn: inner resonance + parting-the-breath, the organ where breath parts inwardنف: رَنينٌ داخِليٌّ + شَقُّ النَّفَسSTRONG
إِصبَع ḏbʿإِصبَع · "finger" 🔑trilateral · ع shared exactly across the familyثُلاثيّ · العين مُشتَرَكةصب/ḏb + ع: firmly-attached pointed depth-gripصب + ع: تَعَلُّقٌ مُحكَمٌ بِقَبضٍ عَميقSTRONG
نَفس nfswنَفس · "soul, breath, self"trilateral · n-f-s exact match across whole familyثُلاثيّ · تَطابُقٌ كامِلٌ في الأُسرةنف + س: inner-resonance + parting-flow, the breath-as-soulنف + س: الرَّنينُ الباطِنُ المُمتَدّ، النَّفَسُ-الرُّوحPERFECT
آمَن mnآمَن · "believe, be steadfast" 🔑bare-binary · the "amen" rootثُنائيّ · جَذرُ «أَمين»من/mn: gathering + inner-resonance, the steadfast holdingمن: تَجَمُّعٌ ثابِتٌ يَرِنّ، الإيمانُ الصَّامِدSTRONG
أَحَبَّ mrjأَحَبَّ · "love" 🔑trilateral · same m-r seed as مَرِض "to suffer"ثُلاثيّ · نَفسُ بَذرة مَرِضمر: passing-running flow, love and pain on one nucleusمر: جَريانٌ عابِر، الحُبُّ والمُعاناةُ في بَذرةٍ واحِدةSTRONG
خاف snḏخاف · "fear"trilateral · parallel s-n fear-stemثُلاثيّ · جَذرٌ s-n مُوازٍسن fear-stem also gives Arabic سَكَن "silence-from-fear"جَذرُ الخوفِ يُعطي السَّكَن أَيضًاSTRONG
خَتَم ḫtmخَتَم · "seal, shut"trilateral · exact 3-consonant match · no shiftsثُلاثيّ · تَطابُقٌ تامّختم: piercing-firmly that gathers-and-seals, the seal-actختم: نَفاذٌ مُحكَمٌ يَختِمPERFECT
نَزَل hꜣyنَزَل / هَوى · "descend, alight" (cross-linked to هَوى)trilateral · same root as هَوىثُلاثيّ · نَفسُ جَذرِ هَوىهو: soft breath that binds and descends gentlyهو: نَفَسٌ ناعِمٌ يَرتَبِطُ وَيَنزِلPERFECT
جَهل ḫmجَهل · "ignorance" 🔑bare-binary · SAME nucleus as خم "cheat" (#9)ثُنائيّ · نَفسُ نَواة خمخم: piercing the sealed-mass, both ignorance (blocked) and cheat (broken) on one seedخم: اختِراقُ المَختوم، الجَهلُ والغِشُّ في بَذرةٍ واحِدةSTRONG
جَلَس ḥmsjجَلَس · "sit, dwell"trilateral · exact ḥ-m-s preservedثُلاثيّ · ح-م-س مَحفوظحمس: warm-gathered-streaming = the dwelling-residing postureحمس: تَجَمُّعٌ حَيٌّ سَيّال، المُكوثSTRONG
سَفَر sfrسَفَر · "travel, depart"trilateral · exact 3-consonant matchثُلاثيّ · تَطابُقٌ تامّسفر: extending-flow + parting + running, the journey-outسفر: سَيَلانٌ + شَقٌّ + جَريان، الرَّحيلSTRONG
لَبِس ḥbsلَبِس · "wear, clothe" 🔑trilateral · b-s clothing-stem preserved with ل/ḥ variantثُلاثيّ · ب-س جَذرُ اللِّباسبس: bound-passage that streams over, the clothing coveringبس: مَمَرٌّ مُلتَصِقٌ يَنسَكِب فَوقَ الجِسمSTRONG
سَتَر sḏrسَتَر · "cover, conceal, lie-down"trilateral · ت↔ḏ dental shiftثُلاثيّ · ت↔ḏست + ر: streaming-completion that runs continuously, the night-coverست + ر: تَمامٌ سَيّالٌ يَجري، غِطاءُ اللَّيلSTRONG
مَرِض mrمَرِض · "be sick, suffer" 🔑trilateral · exact m-r match · same seed as "love"ثُلاثيّ · م-ر · نَفسُ بَذرة الحُبّمر: passing-running pain, and the same nucleus also carries loveمر: جَريانُ الأَلَم، ونَفسُ النَّواةِ تَحمِلُ الحُبَّSTRONG
شَفى snbشَفى · "heal, make whole"trilateral · health-stem on s-n baseثُلاثيّ · جَذرُ العافِيةسن: restoring-flow that binds, the body made wholeسن: سَيَلانٌ مُرَمِّمٌ يَرتَبِط، العافِيةSTRONG
شَنّ šnشَنّ · "surround, encircle"geminate · exact two-way match · the shen-ring rootمُضَعَّف · جَذرُ حَلَقةِ شَنشن: wide spread that resonates inward, the encircling-loadشن: انتِشارٌ يَرِنُّ داخِلًا، الإحاطةSTRONG
أَنا jnkأَنا · "I"nasal pronoun stem · universal Afro-Asiaticضَميرٌ ناسِخٌ · كَونيّأن/jn: originating-affirmation + inner-resonance, the self-asserting voiceأن: تَأكيدُ النَّفس، الصَّوتُ الذاتيّPROTO-FAMILY
أَنتَ ntkأَنتَ · "you (m.)"n+t pronoun stem · universalضَميرٌ · كَونيّنت: inner-resonance extended outward to youنت: رَنينٌ مُمتَدٌّ إلَيكَPROTO-FAMILY
قَدِم/قَديم qdقَدِم / قَديم · "ancient, build, form"trilateral · q-d exact matchثُلاثيّ · ق-د تَطابُققد: firm-cut settled fixity, the established-of-oldقد: قَطعٌ مُحكَمٌ مُستَقِرّ، القَديمُ المَبنيّSTRONG
حَكَم ḥkꜣحَكَم / حِكمة · "wisdom, judge, magic"trilateral · h-k preservedثُلاثيّ · ح-ك مَحفوظحك: warm containment held in sealed precision, wisdom-as-secret-knowledgeحك: احتِواءٌ مَختومٌ بِدِقّة، الحِكمةSTRONG
حَطّ ḥtpحَطّ · "settle, rest, contented"geminate/trilateral · ح-ط preservedمُضَعَّف · ح-طحط: warm containment + heavy spreading, settling-into-restحط: احتِواءٌ + انبِساطٌ ثَقيل، السُّكونSTRONG
جسر jsrجِسر · "bridge, crossing"trilateral · same rootثُلاثيّ · نَفسُ الجَذرجس + ر: gathered crossing extending and runningجس + ر: حَيِّزٌ يَمتَدُّ ويَجريPERFECT
يَمّ yamيَمّ · "sea, ocean"cross-family universal · also Hebrew יָם, Akkadian yamuكَونيّ في الأُسرة · עברית יָםيم: gentle-extension binding the gathered mass, the seaيم: امتدادٌ يَربِطُ الكَتلةَ، البَحرSTRONG
عَيش ʿqwعَيش · "bread, life-sustenance"trilateral · ع shared in family bread-stemثُلاثيّ · العين في جَذرِ الخُبزعيش: depth-grip + flow, bread as the life-giving sustenanceعيش: قَبضُ العُمق + سَيَلان، الخُبزُ يُحييSTRONG

▸ Open the interactive 200-entry browser (sort · filter · search · 🔑 revelations) →▸ افتَح المُتَصَفِّحَ التَّفاعُليَّ لِلـ200 مَدخَل (تَرتيب · تَصفِية · بَحث · 🔑 الكَشوفات) ←
→ Or read the full markdown audit with per-entry framework reading← أَو اقرَأ التَّدقيقَ الكامِل بِقِراءةٍ مُفَصَّلةٍ لِكُلّ مَدخَل · ⬇ JSON data⬇ بَيانات JSON

What this 200-entry roster establishesما تُثَبِّتُهُ هذه الرُّوزنامةُ (200 مَدخَلًا)

199 of 200 framework-readable (99.5%) · 0 forced. Verdict distribution across the full vocabulary spectrum: 11 PERFECT (same root, zero shifts) + 7 PROTO-AFRO-ASIATIC (family-shared pronouns/particles) + 1 DUAL-FACE PAIR + 78 STRONG (predictable articulator-class shifts) + 18 PARTIAL + 84 PROVISIONAL. Top-three-tier hit-rate: 55%, over twice the calibrated distant-IE pool (25%). Deep-family-core hit-rate (the 20 most-shared family-wide words): 90%. The PROVISIONAL share is honest: once you go past the most-shared vocabulary into animals, plants, tools, abstract terms, categories where surface lexicon naturally diverged across 6,000 years, the framework still *reads* the words coherently, but the consonants no longer align directly. The structural revelations the audit surfaced (metathesis cognates, dual-face L3 swaps, polysemy as evidence of shared seed, articulator-class shifts that align hidden semantics) are catalogued in a dedicated section of the doc.

199 مِن 200 يَقرَؤها الإطار (99.5%) · 0 افتِعال. التَّوزيع عَبرَ طَيف المُفرَدات كُلِّه: 11 تامّ + 7 بِدائيّةٌ أَفروأَسيويّة + 1 زَوجٌ ذو وَجهَين + 78 قَويّ + 18 جُزئيّ + 84 مُؤَقَّت. مُعَدَّلُ الإصابةِ في أَعلى ثَلاثة أَصناف: 55%، أكثَرُ مِن ضِعفِ الحَوضِ الهندوأوربيّ المُعايَر (25%). وَفي القَلبِ العَميقِ المُشتَرَك (الـ 20 كَلِمةَ الأَكثَر اشتِراكًا أُسَريًّا): 90%. نِسبةُ المُؤَقَّت صادِقة: حينَ نَتَجاوَزُ المُفرَداتِ الأَكثَر اشتِراكًا إلى الحَيوانات وَالنَّبات وَالأَدَواتِ وَالمُصطَلَحاتِ المُجَرَّدة، فِئاتٌ تَباعَدَت طَبيعيًّا عَبرَ 6,000 سَنة، يَبقى الإطارُ يَقرَأ الكَلِماتِ بِتَماسُك، لَكِنَّ الصَّوامِتَ لم تَعُد تَتَطابَق مُباشَرة.

↑ The number was never a ceiling, 52% → 55% on honest re-attack. A second-attack audit re-examined every entry the first pass filed as "different roots," and a large share cracked open once we looked for the right Arabic word instead of the obvious one (ḏw "mountain" → طَود not جبل · ḏrt "hand" → ذِراع · qs "bone" → قَصَب · sšn "lotus" → سَوسَن). Two further rounds confirmed those and mined 83 cracked-or-new pairs this session, several exact 3-consonant matches (ḫsf ↔ خَسَف · šnꜥ ↔ شَنِئ · ḥḏn ↔ حَزَن · ḏrw ↔ ذِروة). 52% was never a ceiling, it measured how early we stopped looking. Full re-attack + open cases being solved together: second-attack · rounds 3–4.

↑ الرَّقمُ في ارتِفاع، لا ثابِت. أعادَت مُراجَعةُ «الهُجوم الثاني» فَحصَ كُلِّ مَدخَلٍ صَنَّفَه التَّمريرُ الأوّلُ «جُذورًا مُختَلِفة»، فانفَتَحَ كثيرٌ منها حينَ بَحَثنا عَنِ الكَلِمةِ العَرَبيّةِ الصَّحيحة بَدَلَ الظاهِرة (ḏw «جَبَل» ← طَود لا جبل · ḏrt «يَد» ← ذِراع · qs «عَظم» ← قَصَب · sšn «لوتس» ← سَوسَن). الـ52% لم تَكُن سَقفًا قَطّ، كانَت تَقيسُ كَم بَكَّرَ التَّمريرُ الأوّلُ في التَّوَقُّف. الهُجومُ الكامِلُ + الحالاتُ المَفتوحةُ قَيدَ الحَلّ: 2026-05-24-aa-second-attack.md.

The Coptic restoration layer, the spoken third witnessطَبَقةُ الاستِعادة القِبطيّة، الشاهِدُ الناطِقُ الثالِث

Hieroglyphic Egyptian was written consonantally, so it dropped weak sounds, which is why لِسان (l-s-n) looked unrelated to hieroglyphic ns. But Coptic, the spoken descendant, restores them: Coptic ⲗⲁⲥ las brings the ل back, and the cognate closes. This 33-entry layer adds that spoken third witness to the Egyptian roster, most entries confirm already-attested cognates rather than making new claims, so it is graded honestly: 2 PERFECT · 23 STRONG · 7 PARTIAL · 1 PROVISIONAL (76% top-tier). Flagship restorations: لِسان↔ns↔ⲗⲁⲥ · نَفْس↔nfsw↔ⲛⲓϥⲉ · ماء↔mw↔ⲙⲱⲟⲩ · مات↔mwt↔ⲙⲟⲩ · طُوب↔ḏbt↔ⲧⲱⲱⲃⲉ. Data: coptic-cognates.json · reading: coptic-egyptian-echoes.md.

المِصريّةُ الهيروغليفيّةُ كُتِبَت بِالصَّوامِت، فأَسقَطَت الأَصواتَ الضَّعيفة، ولِذا بَدَت لِسان (ل-س-ن) غَيرَ مُتَّصِلةٍ بِالهيروغليفيّ ns. لَكِنّ القِبطيّةَ، الذُّرِّيّةَ المَنطوقة، تَستَعيدُها: القِبطيّةُ ⲗⲁⲥ las تُعيدُ اللامَ، فيَنغَلِقُ الجِنَاس. هذه الطَّبَقةُ (33 مَدخَلًا) تُضيفُ الشاهِدَ الناطِقَ الثالِثَ، ومُعظَمُها يُؤَكِّدُ جِنَاساتٍ مُثبَتةً سَلَفًا، فدُرِّجَت بِصِدق: 2 تامّ · 23 قَويّ · 7 جُزئيّ · 1 مُؤَقَّت (76٪). البَيانات: coptic-cognates.json.

Sanskrit, the most distant branch, read through the same fixed chargesالسنسكريتيّة، أبعَدُ الفُروع، تُقرَأُ بِنَفسِ الشَّحَناتِ الثابِتة

Sanskrit is the most distant branch tested. We do not grade it by genetic cognacy, we read each word's own sounds through the 28 fixed charges and ask one question: does the gesture compose to its attested meaning? In the deep core, kin, body, number, basic action, it does, and it composes cleanly: 30 worked entries · 11 PERFECT · 18 STRONG · 1 PARTIAL (97% top-tier). Several land exact through the charges: قرن↔karṇa (k-r-n ↔ q-r-n, the curved projection with a resonance cavity = horn / ear), منى↔man (m-n, inner concentration rising as thought), طنّ↔tan (ṭ-n, the dental pull into a vibrating line = tension), مخّ↔makha (m-ḫ, the gathered mass pierced = inner essence), نخس↔nakha (n-ḫ, the directional point that pricks = nail), ناموس↔namas (n-m-s exact = bowing in reverent submission). These are not borrowing claims, and not coincidences at distance: when the same gesture builds the same meaning this far out, the framework reads it as a surviving trace of one original tongue, the original Arabic, whose sound-meaning logic Qur'anic Arabic kept most intact. The reading is honest, not blind: the single PARTIAL (أخ↔bhrātṛ) is where the skeleton only half-aligns, read, not forced. Each entry carries its charge-reading and a Monier-Williams source. Data: sanskrit-cognates.json · reading: sanskrit-indo-iranian-echoes.md.

السنسكريتيّةُ أبعَدُ الفُروعِ التي اختَبَرناها. لا نُدَرِّجُها بِالقَرابةِ الجينيّة، بَل نَقرَأُ أَصواتَ كُلِّ كَلِمةٍ بِذاتِها عَبرَ الشَّحَناتِ الثَّمانِ والعِشرينَ الثابِتة، ونَسألُ سُؤالًا واحِدًا: هَل تُرَكِّبُ الإيماءةُ مَعناها المُثبَت؟ في القَلبِ العَميق، القَرابةُ والجَسَدُ والعَدَدُ والفِعلُ الأساس، تُرَكِّبُهُ، وتُرَكِّبُهُ بِوُضوح: 30 مَدخَلًا مَدروسًا · 11 تامّ · 18 قَويّ · 1 جُزئيّ (97٪ في أعلى الأَصناف). وعِدّةٌ مِنها تامّةٌ عَبرَ الشَّحَنات: قرن↔karṇa (q-r-n ↔ k-r-n)، منى↔man (m-n)، طنّ↔tan (ṭ-n)، مخّ↔makha (m-ḫ)، نخس↔nakha (n-ḫ)، ناموس↔namas (n-m-s تامّ). وهذه ليسَت دَعاوى استِعارة، ولا مُصادَفاتٍ عِندَ البُعد: حينَ تَبني الإيماءةُ نَفسُها المَعنى نَفسَه على هذا البُعد، يَقرَؤها الإطارُ أَثَرًا باقِيًا مِن لِسانٍ أصليٍّ واحِد، العَربيّةِ الأولى، حَفِظَت العَربيّةُ القُرآنيّةُ مَنطِقَه أَتَمَّ حِفظ. والقِراءةُ صادِقةٌ لا عَمياء: الجُزئيُّ الوَحيدُ (أخ↔bhrātṛ) هو حَيثُ يَتَطابَقُ الهَيكلُ نِصفًا، قِراءةٌ لا افتِعال. وكُلُّ مَدخَلٍ يَحمِلُ قِراءَتَه الشَّحنيّة ومَصدَرَه مِن مونييه-وِليامز. البَيانات: sanskrit-cognates.json.

The universal floor: the words a baby learns firstالأَرضيّةُ الكَونيّة: الكَلِماتُ التي يَتَعَلَّمُها الطِّفلُ أوّلًا

The preservation gradient, Arabic most intact, then Hebrew, Aramaic, Egyptian, and the more distant branches, raises one question: is there a layer so deep it survives in every branch? There is. Go as far as Chinese, a completely different writing system and structure, and the root-level matches thin out, but the deepest stratum still holds: the words a human infant forms first, mother, I, this, reach for the same mouth-gesture across the branches that drifted furthest apart. This is the floor of the gradient: the original tongue's logic at its most indestructible. It is not zero, it is universal.

تَدَرُّجُ الحِفظ، العَرَبيّةُ أَتَمُّ حِفظًا، ثُمّ العِبريّة، فالآراميّة، فالمِصريّة، فالفُروعُ الأَبعَد، يَطرَحُ سُؤالًا: هَل ثَمّةَ طَبَقةٌ مِنَ العُمقِ بِحَيثُ تَنجو في كُلِّ فَرع؟ نَعَم. اذهَب بَعيدًا كَالصِّينيّة، بِنِظامِ كِتابةٍ وبِنيةٍ مُختَلِفَين كُلِّيًّا، وستَرِقُّ المُطابَقاتُ على مُستَوى الجَذر، لَكِنّ الطَّبَقةَ الأَعمَقَ تَثبُت: الكَلِماتُ التي يُكَوِّنُها الطِّفلُ أوّلًا، أُمّ، أَنا، هذا، تَمُدُّ يَدَها إلى نَفسِ حَركةِ الفَمِ عَبرَ أَبعَدِ الفُروعِ تَباعُدًا. هذه أَرضيّةُ التَّدَرُّج: مَنطِقُ اللِّسانِ الأصليِّ في أَمتَنِ صُوَرِه. ليسَت صِفرًا، هي كَونيّة.

Meaning · gestureالمعنى · الحركة عربيّ עברית Egyptianمصريّ 中文 Other familiesفصائل أخرى
MOTHER · م lips gather (nursing)انطباقُ الشَّفَتَين (الرَّضاعة) أُمّ · ماما אֵם · אִמָּא mwt amma (Tamil) · mama (Swahili, Quechua)
I / WE · ن inner resonanceرَنينٌ مِنَ الدّاخِل أَنا · نَحنُ אֲנִי · אֲנַחְנוּ jnk · jn-n (you) anāku (Akkadian)
THIS / HERE · د tongue taps to pointنَقرةُ اللسانِ لِلإشارة ذا · دي · هذا זֶה dy · djt zhè this / that (English)
Confirmed by the most universal data on Earth · and Chinese shows the principle is bigger than soundمُؤَكَّدٌ بِأَكثَرِ البَياناتِ كَونيّةً على الأرض · والصِّينيّةُ تُبَيِّنُ أنّ المبدأَ أكبَرُ مِنَ الصَّوت

Murdock (1959) surveyed 1,072 languages and found the word for mother uses a nasal (m/n) in the overwhelming majority, far above chance. Jakobson (1960) explained why: the m is the sound a nursing infant makes with lips closed. The framework reads م as gathering, the gathered source, exactly this, from first principles. And Chinese adds a twist: its characters began as pictures (水 was a drawing of flowing water, 山 of mountains). Arabic encodes meaning in the shape the mouth makes; Chinese in the shape the hand draws. Two roads, one destination: meaning living in the form of the sign, not arbitrarily assigned to it. Full evidence + references: universal-baby-words.md.

مَردوك (1959) مَسَحَ 1,072 لُغة فَوَجَدَ أنّ كَلِمةَ الأُمّ تَستَعمِلُ صَوتًا أَنفيًّا (م/ن) في الغالِبيّةِ الساحِقة، فَوقَ الصُّدفةِ بِكَثير. ياكوبسون (1960) فَسَّرَ السَّبَب: الـم هو الصَّوتُ الذي يُصدِرُه الرَّضيعُ بِشَفَتَين مُنطَبِقَتَين. والإطارُ يَقرَأُ م كَـتَجَمُّعٍ، المَصدَرِ المَجموع، هذا بِالضَّبط، مِنَ المَبادئِ الأُولى. والصِّينيّةُ تُضيفُ لَفتة: حُروفُها بَدَأَت صُوَرًا (水 كانَ رَسمًا لِجَريانِ الماء، 山 لِلجِبال). العَرَبيّةُ تُرَمِّزُ المَعنى في شَكلِ ما يَفعَلُه الفَم؛ والصِّينيّةُ في شَكلِ ما تَرسُمُه اليَد. طَريقانِ، وَجهةٌ واحِدة: المَعنى يَسكُنُ في صورةِ العَلامةِ، لا يُسنَدُ إلَيها اعتِباطًا. التَّفصيلُ والمَراجِع: universal-baby-words.md.

The roster keeps growing, more cognates being confirmedالرُّوزنامةُ تَنمو، والمزيدُ مِنَ النَّظائر في طَريقه إلى التأكيد

Beyond the confirmed Tier-A entries, the pipeline holds 880+ Arabic ↔ Greek/Latin candidate pairs in active verification, and 11 have already been promoted to Tier-A across three rounds. These three are next in line: each already clears most of the four-bar rubric, and the column on the right shows the one piece of evidence that will lift it.

إلى جانِبِ نَظائرِ الصِّنف الأوّل المُؤَكَّدة، يَحمِلُ الأنبوبُ أَكثَرَ مِن 880 زَوجًا عَرَبيًّا ↔ يونانيًّا/لاتينيًّا قَيدَ التَّحَقُّق النَّشِط، وقد رُقِّيَ 11 مِنها إلى الصِّنف الأوّل عَبرَ ثَلاث جَولات. وهذه الثَّلاثةُ هي التالية في الصَّفّ: كُلٌّ مِنها يَجتازُ مُعظَمَ الضَّوابطِ الأربعة، والعَمودُ الأيمَنُ يُبَيِّنُ الشاهِدَ الواحِدَ الذي سيَرفَعُها.

Arabic rootالجذر العربيّ Proposed cognateالنَّظير المُقترَح What lifts it to Tier-A nextما سيَرفَعُها إلى الصِّنف الأوّل
ك-ت-بtype / Gr. κτύπος / stampHebrew כתב is already solid, one clean Indo-European witness completes the dual-family barالعبريّة כתب راسِخةٌ بالفِعل، شاهِدٌ هندوأوربيٌّ نظيفٌ واحِدٌ يُكمِلُ ضابِطَ الفَصيلَتَين
خ-ل-قLat. colerecolony, cultSkeleton + recognition already pass; pinning the shared nucleus (create ↔ cultivate) closes itالهَيكلُ والإدراكُ يَجتازان؛ وتَثبيتُ النَّواةِ المُشتَركة (خَلق ↔ رِعاية) يُغلِقُها
ض-ح-وLat. dies / Eng. day / PIE *dyeu-Indo-European side is very strong; one more Semitic attestation completes the bridgeالجانِبُ الهندوأوربيُّ قَويٌّ جِدًّا؛ وشاهِدٌ سامِيٌّ إضافيٌّ يُكمِلُ الجِسر

Browse the full live candidate pool, both discovery and calibrated scores, in the interactive discoveries dashboard → تَصَفَّح حَوضَ المُرَشَّحاتِ الكامِلَ، بِنُقاطِ الاكتِشافِ والمُعايَرة، في لَوحةِ الاكتِشافاتِ التَّفاعُليّة ←

Why you can trust this roster, the four-bar bar in action لِماذا تَثِقُ بِهذه الرُّوزنامة، ضوابطُ التَّحَقُّقِ الأربعةُ في العَمَل

The confirmed roster is strong precisely because the bar is high. Surface resemblances that do not clear the consonant-skeleton bar are turned away and never enter the confirmed set, for example ع-ل-م ✗ signum (skeleton S-N vs ʿ-L-M), ق-ر-أ ✗ legere (Q-R vs L-G), ن-و-ر ✗ lumen (N-R vs L-M), and ي-ت-م ✗ yatīm (a historical loan from Arabic, not a parallel emergence). The full verification record, including every declined candidate, lives in tafsir-coran-tier-a-cognates.md. الرُّوزنامةُ المُؤَكَّدةُ قَويّةٌ تَحديدًا لأنّ المِعيارَ عالٍ. التَّشابُهاتُ السَّطحيّةُ التي لا تَجتازُ ضابِطَ الهَيكلِ الصَّامتيّ تُرَدُّ ولا تَدخُلُ المَجموعةَ المُؤَكَّدةَ أبَدًا، مِثل ع-ل-م ✗ signum، وق-ر-أ ✗ legere، ون-و-ر ✗ lumen، وي-ت-م ✗ yatīm (استِعارةٌ تاريخيّةٌ مِن العَرَبيّةِ لا بُروزٌ مُوازٍ). السِّجِلُّ الكامِلُ، بِكُلِّ مُرَشَّحٍ مَردود، في tafsir-coran-tier-a-cognates.md.

Phenomenological, not etymologicalقراءةٌ ظاهراتيّة، لا اشتقاقيّة
These are not historical-loanword claims, and not "same mouth, separate inventions" coincidences either. They read the shared sound-meaning logic the branches inherited from one original tongue: where an attested Arabic word and another branch's word land on the same sonic-semantic nucleus, read through the fixed charges, that is a surviving trace of the common source. Note the asymmetry of evidence, in the framework's favour: the Arabic root ك-ف-أ is an attested word in Quranic and classical Arabic (Q 112:4); the proposed Indo-European ancestor for copy (PIE *op-) is a reconstruction, a hypothetical proto-form. The attested Semitic word is the firmer witness of the two. The reading is not a competing etymology; it is a reading of how the original tongue bound meaning to the gesture, and how that binding survived down the branches. هذه ليست دَعاوى استعارةٍ تاريخيّة، ولا مُصادَفاتٍ مِن نَوعِ «الفمُ نفسُه، اختِراعاتٌ مُنفَصِلة». بل هي قِراءةٌ لِمَنطِقِ النُّطق-المَعنى الذي وَرِثَتهُ الفُروعُ مِن لِسانٍ أصليٍّ واحِد: حَيثُ تَلتَقي كَلِمةٌ عربيّةٌ ثابتةٌ وكَلِمةُ فَرعٍ آخَرَ على النَّواةِ الصوتيّة-الدلاليّة نفسِها، مَقروءةً عَبرَ الشَّحَناتِ الثابِتة، فذلكَ أَثَرٌ باقٍ مِنَ المَصدَرِ المُشتَرَك. ولْنُلاحظ عَدَم تَوازُن الشَّواهد لِصالِحِ الإطار: الجذر العربيّ ك-ف-أ كَلِمةٌ ثابتةٌ مُستَعمَلة في القرآن والعربيّة الكلاسيكيّة (سورة الإخلاص 112:4)؛ أمّا الأصل الهندوأوروبيّ المُقتَرَح لِـcopy (PIE *op-) فهو إعادةُ بِناءٍ افتراضيّة، صيغةٌ بدائيّةٌ مَفروضة. فالكَلِمةُ السامِيّةُ الثابِتةُ هي الشاهِدُ الأَوثَقُ مِنهُما. والقِراءةُ ليست اشتقاقًا مُنافسًا، بل قِراءةٌ لِكَيفَ رَبَطَ اللِّسانُ الأصليُّ المَعنى بِالإيماءة، وكَيفَ بَقِيَ ذلكَ الرَّبطُ في الفُروع.
06 · Academic foundation6 · الأرضيّة الأكاديميّة

Who we're standing on

عَلى أَكتافِ مَن نَقِف

This is not a new idea, freshly invented. It is a thread that goes back twelve centuries, to al-Khalīl al-Farāhīdī's *Kitāb al-ʿAyn* and Ibn Jinnī's "the sounds of letters echo the shapes of their meanings." In the modern era, Dr Muhammad Hassan Jabal's *Etymological Dictionary* and Hassan Abbas's *Properties of the Arabic Letters* gave us the data and the sensory axis we test against. This study extends their work; it does not replace it.

ليسَت هذه فِكرةً جَديدةً اخْتُرِعَت اليَوم. هي خَيطٌ يَمتَدُّ اثنَي عَشَر قَرنًا، مِن «كتاب العين» لِلخَليل بن أَحمَد الفَراهيديّ، وَ«إمْساس الأَلفاظ أَشباهَ المَعاني» عند ابن جِنّي. وَفي عَصرِنا، أَعطانا «المُعجَم الاشتِقاقيّ المُؤَصَّل» لِلدكتور محمد حسن جَبَل، وَ«خصائص الحُروف العَرَبيّة ومَعانيها» لِحَسَن عَبّاس، البَياناتِ والمِحوَر الحِسّيَّ اللذَين نَختَبِرُ عَلَيهِما. هذه الدِّراسةُ تَمتَدُّ مِن عَمَلِهِم، لا تَحُلُّ مَحَلَّه.

التقليد العربيّ الكلاسيكيّ
The classical Arabic tradition
12+ centuries · the foundation12 قَرنًا فأكثر · الأرضيّة

From الخليل بن أحمد الفراهيدي (founder of Arabic linguistics, 8th c., Kitab al-Ayn) through ابن جنّي in al-Khasais (11th c., the إمساس الألفاظ أشباه المعاني doctrine on form-meaning correspondence), the classical lexicographers and grammarians worked out the architecture of root, derivation, and articulation that this study extends. See classical-survey-ar.md for the full survey.

من الخليل بن أحمد الفراهيديّ (مُؤسِّس اللغويّات العربيّة، القرن الثاني الهجريّ، «كتاب العين») إلى ابن جنّي في «الخصائص» (القرن الرابع، باب «إمساس الألفاظ أشباه المعاني» في تَلازُم الشكل بالمعنى)، وعُلَماء المعجم والنحو الكلاسيكيّين، وَضَعوا مِعمار الجذر والاشتقاق والنُّطق الذي تَمتدّ منه هذه الدراسة. انظر classical-survey-ar.md لِلمسح الكامل.

د. محمد حسن جبل
Dr. Muhammad Hassan Jabal
primary modern foundationالقاعدة الحديثة الرئيسة

المعجم الاشتقاقي المؤصَّل, the canonical dataset every layer of this study tests against: 2,300 unique roots total (2,288 trilaterals + 12 quadri/quintilaterals), 2,285 trilaterals graded under the operative grammar to date, 453 binary nuclei, 1,666 Quranic applications. Jabal's compositional model (letter → binary → trilateral) is the structural skeleton; the study's new findings (universal dual-face, 11-mode native operative grammar + LOANWORD label) refine it against his own data.

«المعجم الاشتقاقيّ المُؤَصَّل»، المُدَوَّنة المَرجعيّة التي تَختبر كلُّ طبقةٍ في هذه الدراسة عليها: 2,300 جذرٍ فريد في المجموع (2,288 ثلاثيّ + 12 رُباعيٌّ وخُماسيّ)، و2,285 ثلاثيًّا قد تَمَّ تَصنيفُها تَحت نَحو العَمَل حتّى الآن، و453 نواةً ثنائيّة، و1,666 تَطبيقًا قرآنيًّا. نموذجُ جَبَل التركيبيّ (حرف ← نواة ← ثلاثيّ) هو الهيكل البنيويّ، والنتائج الجديدة لِلدراسة (قاعدةُ الوَجهَين العامّة، والأَبواب الأَحَدَ عَشَر الأَصيلة مع مَدخَل الدَّخيل) تُنَقِّحه على بياناته نفسها.

حسن عبّاس
Hassan Abbas
28 letters · sensory profiles28 حرفًا · بَصمات حِسّيّة

خصائص الحروف العربيّة ومعانيها (Arab Writers Union, 1998). Six sensory categories crossed with three evolutionary mechanisms (هيجانيّة / إيمائيّة / إيحائيّة). The framework absorbs his sensory axis and tests it across the full nucleus catalog.

«خصائص الحروف العربيّة ومعانيها» (اتّحاد الكتّاب العرب، 1998). ستّ فئاتٍ حِسّيّة مَضروبةٌ في ثلاث آليّاتٍ تَطَوُّريّة (هيجانيّة / إيمائيّة / إيحائيّة). تَستوعِب الدراسةُ محورَهُ الحِسّيّ وتَستقرئه على ديوان النوى الكامل.

07 · Where the study stands7 · أين تَقِف الدراسة

What's done · what's next

ما أُنجِزَ · وما هو القادِم

The bottom-up core (letter → seed-meaning → trilateral root) is settled and tested. The cross-linguistic work is live and ongoing.

النَّواةُ الصاعِدةُ (حَرف ← بَذرة مَعنى ← جَذر ثُلاثيّ) مُستَقِرّةٌ ومُختَبَرة، والعَمَلُ بَينَ اللُّغاتِ حَيٌّ مُستَمِرّ.

✓ Settled✓ المُستَقِرّ

⟳ In progress & next chapters⟳ قَيد العَمَل والفُصول القادِمة

For collaboratorsلِلمُتعاوِنين
Every item in the agenda is self-contained and ready for independent work. The position paper at our-contributions-and-roadmap.md contains the full methodological detail for each line. كلّ بَندٍ في الخارطة قائمٌ بِذاته وجاهزٌ لِلعمل المستقلّ. الورقة الموقفيّة في our-contributions-and-roadmap.md تَحوي التفصيل المنهجيّ الكامل لِكلّ سطر.
08 · About this study8 · عن الدراسة

About & contact

عن الدراسة وللتواصل

Conducted underتُجرى تحت

تَمَسُّك للبحوث والنشر والتدريب

Temessek · Research · Publishing · Training

Temessek is the institutional home of this study and its sister works in Quranic linguistics. What you see on this page, the unified 28-letter table, the 453-nucleus catalog, the eleven native composition modes (plus the LOANWORD label), and the cross-linguistic verification rubric, is published, taught, and applied under the Temessek imprint.

تَمَسُّك هي البيتُ المؤسّسيّ لِهذه الدراسة وأعمالها الشقيقة في اللسانيّات القرآنيّة. ما يُعرَض على هذه الصفحة، جدولُ الحروف الثمانية والعشرين المُوَحَّد، وديوانُ الأربعمائة والثلاث والخمسين نواةً، وأبوابُ التركيب الاثنا عشر، وضوابطُ التحقّق بين اللغات، يُنشَر ويُدرَّس ويُطَبَّق تحت اسم تَمَسُّك.

Principal investigatorالباحث الرئيس

Yassine Temessek
Conducts the study and authors all primary artifacts. Reachable by email for collaboration, critique, or citation requests.
يُجري الدراسة ويُؤلِّف جميع المُخرَجات الأوّليّة. مَتاحٌ عبر البريد للتعاون والنقد وطلبات الاستشهاد.

Public reading platformمنصّة القراءة العامّة

Where the framework is applied to Quranic verses in practice: published readings, the editorial protocol in action, and the worked examples behind the methodology.
حيث تُطَبَّق المَنظومة على الآيات القرآنيّة في الممارسة: قراءاتٌ منشورة، والبروتوكول التحريريّ في العَمَل، والأمثلة التطبيقيّة وراء المنهج.

Computational side of the projectالجانب الحاسوبيّ من المشروع

Juthoor-Linguistic-Genealogy
The same Juthoor project, from the computational side: an open methodology that implements the LV0–LV3 architecture, runs the eleven-mode trilateral reading (with a LOANWORD label), and produces the audits behind the claims on this page.
جزءٌ مِن مَشروع جُذور نَفسِه، يُمَثِّل جانِبَه الحاسوبيّ: مَنهَجيّةٌ مَفتوحةٌ تُنَفِّذ مِعماريّةَ LV0–LV3، وتُجري قِراءةَ الجَذر الثُّلاثيّ على الأَبواب الأَحَدَ عَشَر الأَصيلة (مَع مَدخَل الدَّخيل)، وتُنتِج التَّدقيقات التي تَستَنِد إليها مَزاعِمُ هذه الصَّفحة.

Status & licenseالحالة والترخيص

Public reference · share freelyمرجعٌ عَلَنيّ · يُشارَك بحرّيّة
Methodology & ruling tables: shareable with attribution. Raw scholar sources in Data raw/: respect original copyrights. Audits and processed extracts: cite back to Temessek · Juthoor.
المنهج والجداول الحاكمة: قابلةٌ لِلمشاركة مع الإسناد. المصادر الأوّليّة في Data raw/: تَحترِم حقوقَ المؤلّفين الأصليّين. الاستخراجات والتدقيقات: تُستشهَد بـتَمَسُّك · جُذُور.

How to read this study from a cold startكيف تقرأ هذه الدراسة من نقطة الصفر

  1. Start with the README.md for the layout overview.
  2. Read our-contributions-and-roadmap.md, the shareable position paper.
  3. Open consensus-letter-charges.md for the canonical 28-letter table.
  4. Browse jabal-nuclei-extended.md for the full nucleus dossier.
  5. See the framework applied to verses at coranisyours.com.
  1. ابدأ بِـ README.md لِفهم البنية العامّة.
  2. اقرأ our-contributions-and-roadmap.md، الورقة الموقفيّة القابلة لِلمشاركة.
  3. افتح consensus-letter-charges.md لِلجدول المُوَحَّد لِلحروف الثمانية والعشرين.
  4. تَصَفَّح jabal-nuclei-extended.md لِلديوان الكامل لِلنوى.
  5. شاهد المَنظومة مُطَبَّقةً على الآيات في coranisyours.com.