DE3821551C2

DE3821551C2 - Datenverarbeitungsvorrichtung

Info

Publication number: DE3821551C2
Application number: DE3821551A
Authority: DE
Inventors: Shunichiro Nakamura; Harumi Minemura; Tatsuo Minohara
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1987-06-23
Filing date: 1988-06-22
Publication date: 1994-04-28
Anticipated expiration: 2008-06-23
Also published as: DE3821551A1; US5058002A; GB2207264A; GB8814848D0

Description

Die vorliegende Erfindung bezieht sich auf eine Da tenverarbeitungsvorrichtung für ein relationales Da tenbanksystem.

Bei einem bekannten Datenbankverwaltungssystem ist eine Datenbank in Form einer Sammlung von Tabellen gemäß Fig. 6 ausgebildet. Eine einzelne Tabelle wird üblicherweise als Relation 11 bezeichnet, wobei jeder Posten der Tabelle als Attribut 18 bekannt ist, und ein Datensatz in dem Attribut nennt sich Tupel 17.

In Fig. 7 ist ein allgemeines Schema eines Datenbank verwaltungssystems gezeigt, das in einer Anlage an wendbar ist, bei der eine Vielzahl von Datenverarbei tungseinheiten 28a bis 28d über ein Netzwerk 29 mit einer Vielzahl von Scheibenspeichereinheiten 2g bis 2j verbunden ist, wobei eine Relation aufgeteilt in der Vielzahl von Scheibenspeichereinheiten 2g bis 2j derart gespeichert wird, daß die Vielzahl von Daten verarbeitungseinheiten 28a bis 28d parallelen Zugriff zu jeder der in der Relation enthaltenen Daten hat. In diesem Schema wird es horizontale Unterteilung genannt, wenn eine einzelne Relation mittels der Tupel horizontal unterteilt wird.

Entsprechend dieser horizontalen Unterteilung ist es in dem Fall, daß eine zu speichernde Relation keine gehäuften Indizes (im folgenden Clusterindizes ge nannt) aufweist, in der Praxis möglich, die Relation in der Weise zu speichern, daß jede der Scheibenspei chereinheiten gleichmäßig viele Tupel aufweisen kann, wenn die zu speichernden Tupel in einen Scheibenspei cher gelegt werden, der gegenwärtig die kleinste An zahl von gespeicherten Tupel hat.

Mit einer derartig gleich verteilten Relation kann die Vielzahl von Datenverarbeitungseinheiten 28a bis 28d Daten von jedem der Scheibenspeicher 2g bis 2j in einem weiten gleichmäßigen Zeitintervall einlesen, und mit dieser Anordnung tritt nicht ein derartiger Fall auf, daß eine bestimmte Datenverarbeitungsein heit noch nicht das Lesen von Daten beendet hat, wäh rend andere schon Daten während eines Datenbearbei tungsvorganges eingelesen haben, wodurch folglich eine erhöhte Datenverarbeitungsgeschwindigkeit mög lich ist.

Dies ist eine typische Konstruktion der horizontalen Unterteilung in einem relationalen Datenbankverwal tungssystem, und dies betrifft ein Unterteilungssy stem, das hauptsächlich für Relationen geeignet ist, die keine Clusterindizes haben. Daher kann dieses Unterteilungssystem nicht bei der Unterteilung einer Relation mit Clusterindizes angewandt werden, und aus diesem Grunde tritt ein Problem auf, daß ein Verar beiten mit hoher Zugriffsgeschwindigkeit zu bestimm ten Tupeln in einer Relation in der Praxis nicht un ter Ausnutzung der Clusterindizes erzielt werden kann.

Als nächstes wird Bezug genommen auf Fig. 8, die schematisch eine typische übliche Datenverarbeitungs einheit zeigt. In dieser Figur ist ein elektronischer Computer oder Hauptrahmen 15, eine Scheibenspeicher einheit 16, die mit dem Hauptrahmen verbunden ist, eine Relation 11, die in einer mit dem Scheibenspei cher 16 verbundenen Datenbank enthalten ist, und ein Clusterindex 12, der der Relation 11 zugeordnet ist, dargestellt. Dieser Clusterindex 12 ist beispielswei se von einer solchen Art, die in der Veröffentlichung von J. D. Ullman "Principle of Database Systems" § 2.4; herausgegeben von der Computer Science Press Inc. (japanische Übersetzung: "Database system no genri", übersetzt von Toshiyasu Kunii, veröffentlicht von Nippon Computer Koyokai; Seite 71, Zeile 15, bis Seite 79, Zeile 17) offenbart ist. Obwohl kein spe zieller Bezug auf den Clusterindex in dieser Litera tur genommen wird, ist offensichtlich das, was als "B-Baum" bezeichnet ist, der Clusterindex.

Im allgemeinen wird eine Anordnung derart vorgenom men, daß Tupel in einer Relation 11 in Übereinstim mung mit einer einem Clusterindex 12 zugeordneten Schlüsselzahl sortiert werden, so wie sie in einer Scheibenspeichereinheit 16 zu speichern sind. In Fig. 9 ist ein Beispiel gezeigt, bei dem Clusterindizes den Attributen (Schlüssel) zugegeben sind, die als ganze Zahl im Bereich von 1 bis 1000 ausgebildet sind. Die Relation 11 kann in Übereinstimmung mit einer gegebenen Schlüsselnummer sortiert werden, wo bei sie in acht Seiten 13a bis 13h aufgeteilt ist und in dem Scheibenspeicher 16 gespeichert ist. Ein Zei ger 14a bestimmt eine Seitenzahl mit einem darin ge speicherten Zeiger 14b, und der Zeiger 14b bezeichnet die Seitenzahlen 13a bis 13h in der Relation 11. Wenn mit einer derartigen Anordnung eine spezielle Schlüsselnummer für ein Tupel spezifiziert ist, kann die Seitenzahl, in der dieses Tupel gespeichert ist, unverzüglich durch Bezug auf die Zeiger 14a, 14b be stimmt werden.

Entsprechend der oben beschriebenen relationalen Da tenbank können alle umfaßten Daten in Form einer Ta belle verwaltet werden. Diese Tabelle wird als Rela tion bezeichnet. Die jeweiligen Daten in den jeweili gen Reihen einer Relation werden als Tupel bezeich net. Jeder Posten (Spalte) einer Relation nennt sich Attribut. Entsprechend dem Beispiel nach Fig. 6 wer den eine Relation mit dem Bezugszeichen 11, Tupel mit den Bezugszeichen 17a bis 17j, und Attribute mit den Bezugszeichen 18a bis 18d gezeigt. In einer relatio nalen Datenbank ist es in der Praxis üblich, daß eine Verarbeitung auf eine Gruppe von Tupel gerichtet wird, die in ihrem Bereich definiert sind, der in Zusammenhang mit bestimmten spezifizierten Attributen oder mit einer Kombination von Attributen (im folgen den als "Schlüssel" bezeichnet) spezifiziert ist.

Beispielsweise kann bei einer Relation 11 nach Fig. 6 eine Verarbeitung derart vorgenommen werden, daß ein Mittelwert des Attributs 18d "Alter" mit dem Tupel "Hauptabteilung" unter dem Attribut 18b des "Namens der Abteilung" erzielt wird. In diesem Beispiel ist das Attribut 18b "Name der Abteilung" ein Schlüssel.

Wenn bei einer üblichen Datenbankverarbeitungseinheit gemäß Fig. 8 eine Verarbeitung an einem Cluster von Tupel, wie sie im Sinne ihres Bereiches in Zusammen hang mit dem Wert des Schlüssels für den Clusterindex definiert sind, durchgeführt wird, bezieht sich der Hauptrahmen 15 auf die Zeiger 14a, 14b der Clusterin dizes 12, dann prüft er, auf welcher Seite der rele vante Tupelcluster gespeichert ist und liest die Tu pel zusammen seitenweise aus der Scheibenspeicherein heit 16 zum Verarbeiten aus. Da der Cluster von Tu pel, wie sie in ihrem Bereich in Übereinstimmung mit dem Schlüsselwert der Clusterindizes definiert sind, seitenweise zusammengesetzt und in der Scheibenspei chereinheit 16 gespeichert wird, wobei ihr Bereich ziemlich beschränkt ist, kann es ausreichen, nur die erforderliche Seite aus der Scheibenspeichereinheit 16 auszulesen, wodurch eine Verarbeitung wesentlich schneller durchführbar ist als in dem Fall, bei dem keine Clusterindizes vorhanden sind.

Beispielsweise ist es in Fig. 9 aufgrund eines Clu sters von Tupel, wie sie mit dem Schlüsselwert im Bereich von 99 bis 190 allein in der Seite 13b vor handen sind, ausreichend, nur die Seite 13b von der Plattenspeichereinheit 16 zu lesen, wodurch eine schnellere Bearbeitung bewirkt wird.

Obwohl eine Verarbeitung mit hoher Geschwindigkeit durch die Anwendung von Clusterindizes gemäß einer üblichen Datenverarbeitungseinheit erzielt werden kann, ist es schwierig, die Datenverarbeitung nach dem Stand der Technik, die von einem einzigen Haupt rahmen per se verwaltet wird, weiter schneller zu machen - eine Forderung, die aufgrund der in letzter Zeit steigenden Nachfrage von Datenbankverwaltungen mit dem stark steigenden Anspruch nach schnellerer Datenverarbeitung aufgetaucht ist.

Aus DE-Z: Elektronik 17, 24.8.1984, S. 39 bis 44, ist eine Transputer-Anordnung bekannt, bei der viele Transputer aneinandergehängt werden können, um belie big ausdehnbare Dateien zu durchsuchen. Diese Anord nung ist nicht als Master-Slave-System ausgebildet, denn alle Transputer-Einheiten haben die gleiche Ka pazität und arbeiten in Übereinstimmung mit dem in ihrem eigenen lokalen Speicher gespeicherten Pro gramm und werden nicht von einem Hauptprozessor ge steuert. Weiterhin ist in dieser Literaturstelle ein sogenannter Datenflußprozessor gezeigt, der z. B. zur Bildverarbeitung dient und bei dem Daten zunächst aus einem Host-Computer in einen Ring gebracht und in diesen mit Tokens versehen werden, die angeben, wel che Operationen mit ihnen durchgeführt werden. Nach dem Durchlaufen des Adreßringes gelangen die Daten in einen Prozessorring, in welchem nach jeder Operation der entsprechende Token entfernt wird. Daten ohne Token werden in den Host-Computer zurückgebracht. Dieser Datenflußprozessor stellt somit keine Daten verarbeitungsvorrichtung für ein relationales Daten banksystem vom Mast-Slave-Typ dar.

W. K. Gilvoi: Rechnerarchitektur, Springer-Verlag, Berlin - Heidelberg - New York, 1981, S. 320-322, zeigt die Struktur von Verbindungseinrichtungen in Mehrprozessor-Systemen, wobei auch eine sternförmige Verbindung von 1 bis n Prozessor-Speicher-Paaren über einen globalen Bus dargestellt ist. Hierzu wird aus geführt, daß eine derartige Verbindung die Auftrags zuweisung favorisiere, d. h. eines der Prozessor-Spei cher-Paare die Rolle der zentralisierten Systemauf sicht übernehmen könne. Jedoch handelt es sich hier bei nicht um eine Datenverarbeitungsvorrichtung für ein relationales Datenbanksystem, bei dem der Haupt speicher Clusterindizes für Attribute einer Relation speichert und eine Mehrzahl von Nebenspeichern eine aufgespaltene Relation speichert, so daß eine Mehr zahl von Nebenprozessen eine Parallelverarbeitung an eine durch einen Schlüsselwert eines Clusterindex definierten Gruppe von Tupeln durchführen kann.

Schließlich wird in DE-Z: Elektronische Rechenanla gen, 23. Jahrgang, 1981, Heft 2, Seiten 61 bis 71, die Software-Implementation assoziativer Speicher be schrieben, die in Form von relationalen Datenbanken verwendet werden können. Es wird insbesondere ein Assoziativspeicher dargestellt, der auf individueller Entities, Mengen und zweistelligen Relationen auf baut. Für diesen Speicher werden drei verschiedene Konzepte der Software-Implementation beschrieben, nämlich ein solches mit Hilfe von Streuspeicherung (Hashing) und Verwaltung der Konflikthälfte durch Listen, ein solches mit Hilfe von B- bzw. B*-Bäumen, und ein solches mit Hilfe von Mikroprogrammierung, die dazu verwendet wird, einen Rechner mit konventio neller Hardware um assoziative Fähigkeiten zu erwei tern. Auch hier erfolgt die Implementation nicht in der Weise, daß ein Hauptspeicher Clusterindizes für Attribute einer Relation und eine Mehrzahl von Neben speichern eine aufgespaltene Relation speichern, der art, daß eine Mehrzahl von Nebenprozessoren eine Par allelverarbeitung an einer durch einen Schlüsselwert eines Clusterindex definierten Gruppe von Tupeln durchführen kann.

Ausgehend von dem anhand der Fig. 6 bis 9 erläu terten Stand der Technik ist es die Aufgabe der vor liegenden Erfindung, eine Datenverarbeitungsvorrich tung für ein relationales Datenbanksystem zu schaf fen, mit der zum Speichern und Verarbeiten von in dem Datenbanksystem enthaltenen Daten, insbesondere einer Relation (Tabelle) mit unterschiedlichen Datensätzen (Tupeln) und unterschiedlichen Datenfeldern (Attribu ten), eine hohe Verarbeitungsgeschwindigkeit erziel bar ist, wobei eine horizontale Unterteilung der Re lation mittels Clusterindizes möglich ist.

Diese Aufgabe wird erfindungsgemäß gelöst durch die im Patentanspruch angegebenen Merkmale.

Die Erfindung betrifft somit eine Datenverarbeitungs vorrichtung für ein relationales Datenbanksystem, bestehend aus einem Hauptprozessor, einem mit dem Hauptprozessor verbundenen Hauptplattenspeicher, der in Form einer B-Baum-Struktur Clusterindizes für At tribute oder für eine Kombination von Attributen ei ner in dem relationalen Datenbanksystem zu verarbei tenden Relation speichert, einer Mehrzahl von Neben prozessoren, die von dem Hauptprozessor gesteuert werden, und einer Mehrzahl von jeweils mit den jewei ligen Nebenprozessoren verbundenen Nebenplattenspei chern, die aufgespalten eine Relation des Datenbank systems speichern, wobei die Relation auf der Grund lage einer Seite für einen Clusterindex in der Weise unterteilt ist, daß die Nebenprozessoren parallel eine Vielzahl von Verarbeitungen an einer Gruppe von Tupeln, wie sie in ihrem Bereich in Zusammenhang mit einem gegebenen Schlüsselwert des Clusterindex defi niert sind, durchführen, wobei, wenn eine Seite voll ständig mit einer Vielzahl von Tupeln der Relation gefüllt wird, zur Speicherung der die Clusterindizes aufweisenden Relation die Seite in einem der Neben plattenspeicher in zwei Hälften teilbar ist und die eine Hälfte der so geteilten Seite in demjenigen der Nebenplattenspeicher speicherbar ist, der gegenwärtig die kleinste Anzahl von die Tupel der Relation ent haltenden Seiten aufweist.

Mittels einer derartigen Vorrichtung, die ein Cluster von Tupel, wie in ihrem in Verbindung mit Schlüssel werten der Clusterindizes definiert, auf der Basis von Seiten aufgeteilt in mit einer Mehrzahl von Ne benverarbeitungseinheiten verbundenen Nebenplatten speichern speichert, kann eine Verarbeitung an einem derartigen Cluster von Tupel parallel durchgeführt werden, wodurch eine hohe Datenverarbeitungsgeschwin digkeit bewirkt wird.

Mit einer derartigen Vorrichtung, bei der eine Rela tion selbst mit Clusterindizes horizontal und gleich mäßig unterteilt werden kann, wobei eine Mehrzahl von Datenverarbeitungseinheiten gleichzeitig einen Zu griff zu einer Mehrzahl von Plattenspeichern haben, kann zusätzlich zu einer hohen Verarbeitungsgeschwin digkeit unter Inanspruchnahme des Vorteils der Clu sterindizes eine Wirkung derart erzielt werden, daß jede Datenverarbeitungseinheit Daten in einem gleich mäßigen Zeitintervall für die Verarbeitung einer vollständigen Datensatzsuche einlesen kann, wodurch das Einlesen von Daten in einem minimalen Zeitraum ermöglicht wird.

Weiterhin kann, da die Verarbeitung an einem Cluster von Tupel, wie sie in ihrem Bereich in Verbindung mit Schlüsselwerten der Clusterindizes definiert sind, parallel durch eine Mehrzahl von Nebenverarbeitungs einheiten durchgeführt werden kann, eine vorteilhafte Wirkung dahingehend erzielt werden, daß die Verarbei tung an einem Cluster von Tupel, wie sie in ihrem Bereich definiert sind, parallel und bei einer hohen Rate durchgeführt werden kann.

Ausführungsbeispiele der Erfindung sind in der Zeich nung dargestellt und werden in der nachfolgenden Be schreibung, die die Merkmale der Erfindung offenbar werden läßt, näher erläutert. In der Zeichnung haben die gleichen Teile gleiche Bezugszeichen.

Fig. 1 ist eine erläuternde schematische Ansicht, die den allgemeinen Zustand der Untertei lung einer Relation mit Clusterindizes mit tels eines bevorzugten Ausführungsbeispie les der vorliegenden Erfindung zeigt;

Fig. 2 ist eine erläuternde schematische Ansicht, die ein Beispiel für das Teilen einer Seite in einer Relation mittels eines bevorzugten Ausführungsbeispiels der vorliegenden Erfindung zeigt,

Fig. 3 ist ein Flußdiagramm, das die Arbeitsweise der erfindungsgemäßen Datenverarbeitungsvorrichtung mittels eines bevorzugten Ausführungs beispiels zeigt,

Fig. 4 ist ein Blockdiagramm einer Daten verarbeitungsvorrichtung entsprechend einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung,

Fig. 5 ist eine schematische Ansicht, die den Zustand einer Unterteilung einer Relation mit Clusterindizes mittels eines bevorzugten Ausführungsbeispiels der vorliegenden Erfindung zeigt,

Fig. 6 ist eine erläuternde schematische Darstellung, die ein Beispiel einer typischen Relation in einer relationa len Datenbank zeigt,

Fig. 7 ist eine schematische Darstellung eines Beispiels eines Systemaufbaus bei Anwendung der Erfindung,

Fig. 8 ist eine Blockdarstellung, die einen allgemeinen Aufbau einer üblichen Datenverarbeitungseinheit zeigt, und

Fig. 9 ist eine schematische Darstellung, die eine typische Anordnung zum Speichern einer Relation mit Clusterindizes bei einem üblichen Datenverarbeitungssystem zeigt.

Unter Bezugnahme auf Fig. 1 wird ein typischer Clusterindex 12 dargestellt.

Jedes der Tupel kann in einer sortierten Reihenfolge in den Seiten 13a-13e gespeichert gesehen werden, die aus einer physischen Speichereinheit in Plattenspeichereinheiten 2a-2d bestehen. In Fig. 1 ist ein typisches Beispiel einer Speicherung gezeigt, bei der Clusterindizes Attributen zuge ordnet sind, die einen Bereich ganzer Zahlen zwischen 1 und 1000 aufweisen, wobei ein Tupel- Cluster mit einer kleineren Zahl eines Schlüssel wertes als 73 beispielsweise in einer Seite 13a des Plattenspeichers 2a gespeichert ist, während die Tupel, die Schlüsselwerte von 73 bis 186 haben, dann in der Seite 13b des Plattenspeichers 2b gespeichert werden. Auf diese Weise kann bei Spezifizierung eines Schlüsselwertes eines Tupels von einem Zeiger 14 ein bestimmter Platten speicher und eine spezifische Seite als zu einem bestimmten Clusterindex zugehörig ermittelt werden.

Wenn ein bestimmtes Tupel in einer Clusterindizes aufweisenden Relation in einer Plattenspeicher einheit gespeichert wird, wie in dem Flußdia gramm nach Fig. 3 gezeigt ist, kann auf einen bestimmten Clusterindex Bezug genommen werden in Übereinstimmung mit einem Schlüsselwert eines korrespondierenden Tupels, um einen Platten speicher und eine zu speichernde Seite zu be stimmen (Schritt 101), und wenn dieses Tupel in der so bestimmten Seite gespeichert ist, wird untersucht, ob die bestimmte Seite gefüllt ist oder nicht (Schritt 102). Wenn festgestellt wird, daß die Seite überlaufen würde, wird sie in zwei geteilt. Eine einer derart geteilten halben Seite wird in einen Plattenspeicher übertragen, der gegenwärtig die kleinste Anzahl von ge speicherten Tupel aufweist (Schritt 103). Fig. 2 zeigt diese Situation, bei der Tupel mit einem Schlüsselwert von 1 bis 100 in einer Seite 3c der Plattenspeichereinheit 2e gespeichert sind, und wenn dann Tupel mit diesem Schlüsselwert von 1 bis 100 in diese Seite 3c eingespeichert werden sollen, wird diese Seite in zwei geteilt, da sie aufgefüllt ist, und Tupel mit Schlüsselwerten von 1 bis 50 werden in der ursprünglichen Seite 3c gespeichert, während Tupel mit Schlüssel werten von 51 bis 100 in einer anderen Seite 3d gespeichert werden. Es sei bemerkt, daß es ein bestimmter Plattenspeicher 2f ist, der zum Speichern der Seite 3d ausgewählt wird und der gegenwärtig die geringste Anzahl von Seiten bestehend aus Tupel einer Relation aufweist. Nach Teilen der Seite folgt ein Reorganisations schritt der Clusterindizes (Schritt 104) und darauf folgen in Wiederholung die Schritte 101 und folgende. Wenn kein Überlauf der Seiten in Schritt 102 festgestellt wird, können diese Tupel in einer bei Schritt 105 festzulegenden Seite gespeichert werden.

Obwohl eine Erläuterung unter Bezugnahme auf dieses Ausführungsbeispiel mit einer System struktur gegeben wurde, die ein die Platten speichereinheiten 2g-2j mit den Datenver arbeitungseinheiten 28a-28d verbindendes Netzwerk 29 aufweist, kann selbstverständlich jeder Netzwerktyp, wie beispielsweise eines des Ringtyps oder des Einzelbustyps oder dergleichen, die zu einem gleichen Ergebnis führen, in der Praxis angewandt werden.

Fig. 4 zeigt ein Blockdiagramm eines bevorzugten Ausführungsbeispiels eines Datenverarbeitungs systems gemäß der Erfindung. Dabei ist eine Primär- oder Hauptverarbeitungseinheit 1 (im folgenden "Hauptprozessor" genannt) eine mit dem Hauptprozessor verbundene Primär- oder Haupt plattenspeichereinheit 2 (im folgenden "Hauptplatten einheit" genannt), eine Reihe von Sekundär- oder Nebendatenverarbeitungseinheiten 3a-3d (im folgenden "Nebenprozessoren" genannt) und eine Reihe von mit den Nebenprozessoren verbundenen Sekundär- oder Nebenplattenspeichereinheiten 4a-4d (im folgenden "Nebenplatteneinheiten" genannt) vorgesehen. Ebenfalls gezeigt werden ein gemeinsamer Speicher 5, zu dem der Hauptprozessor und die Nebenprozessoren 3a-3d über einen gemeinsamen Bus 6 Zugriff haben, eine Mehrzahl von lokalen Speichern 7a-7d, auf die die Nebenprozessoren 3a-3d über lokale Busleitungen 8a-8d zugreifen, eine Mehrzahl von Unterbrechungs-Signalleitungen 9a-9d, die für die Kommunikation zwischen Haupt- und Nebenprozessoren 3a-3d über ein Unterbrechungs signal verwendet werden, und eine Eingangs-/Ausgangs leitung 10 für die Ein- und Ausgabe von Daten zwischen einem anderen Computer oder einem externen Terminal und dem Hauptprozessor. Weiterhin wird eine mit 11 bezeichnete Relation gezeigt, die in vorbestimmte Einheiten (z. B. 2 K Byte) (im folgenden als "Seiten" bezeichnet) eingeteilt sein kann und aufgeteilt auf der Grundlage dieser Seiten in den Nebenplatteneinheiten 4a-4d gespeichert werden kann. Außerdem ist eine Reihe von mit 12 be zeichneten Clusterindizes für die Relation 11 dargestellt, die in der Hauptplatteneinheit 2 gespeichert ist. Die Clusterindizes weisen eine B-Baumstruktur auf und die Tupel in der Relation 11 können in Übereinstimmung mit einem gegebenen Schlüsselwert zu den Clusterindizes 12 sortiert werden und in eine gewünschte Anzahl von in die Nebenplattenspeichereinheiten 4a-4d zu speichernden Seiten unterteilt werden. Fig. 5 ist eine schematische Darstellung, die beispielhaft die Bereitstellung von Cluster indizes zu den Attributen (Schlüsseln) zeigt, die einen Bereich ganzer Zahlen von 1 bis 1000 aufweisen. Die Relation 11 kann in Überein stimmung mit gegebenen Schlüsselwerten sortiert und in acht Seiten 13a-13h aufgeteilt werden. Die Seiten 13a + 13e können in der Nebenplatten einheit 4a, die Seiten 13b und 13c in der Neben platteneinheit 4b, die Seiten 13d und 13h in der Nebenplatteneinheit 4c und die Seiten 13f und 13g in der Nebenplatteneinheit 4d gespeichert werden. Beispielsweise können Tupel mit einem Schlüsselwert kleiner als 99 in Seite 13a der Nebenplatteneinheit 4a und solche mit einem Schlüsselwert im Bereich von 99 bis 190 in Seite 13b der Nebenplatteneinheit 4b ge speichert werden. Ein Zeiger 14a ist mit der Zahl einer Seite in der Hauptplatteneinheit versehen, in der ein Zeiger 14b gespeichert ist und ein Zeiger 14b ist mit der Zahl einer Nebenplatteneinheit, in der die Relation 11 gespeichert ist und der Zahl einer Seite dieser Platteneinheit versehen. Wenn mit dieser An ordnung ein Schlüsselwert eines Tupels spezifiziert wird, kann eine spezifische Nebenplatteneinheit und Seite, in der dieses besondere Tupel ge speichert ist, durch Wegermittlung der Zeiger 14a, 14b zu dem Clusterindex gefunden werden.

Unter Bezugnahme auf Fig. 4 wird die Operation erläutert, wie ein Cluster von Tupel, die in ihren Bereichen in Verbindung mit gegebenen Schlüsselwerten der Clusterindizes definiert sind, verarbeitet wird. Ein Cluster von in ihrem Bereich definierten Tupeln ist in eine Vielzahl von Seiten aufgeteilt und möglichst gleichmäßig in vier verschiedenen Nebenplattenspeichern gespeichert. Beispielsweise sei bemerkt, daß unter Bezugnahme auf Fig. 5 ein Cluster von Tupel, die Schlüsselwerte zwischen 190 bis 789 aufweisen, in vier Seiten 13c bis 13f aufgeteilt ist, die jeweils in den Nebenplatteneinheiten 4b, 4c, 4a und 4d gespeichert werden. Wenn eine Anfrage zur Verarbeitung des Tupelclusters von einem anderen Computer oder einem externen Terminal über die Eingangs-/Ausgangsleitung 10 kommt, dann arbeitet der Hauptprozessor 1, um auf die Zeiger 14a, 14b zu den Clusterindizes 12 Bezug zu nehmen, die Zahlen der Nebenplatten- Einheiten und der Seiten zu suchen, in denen der relevante Tupelcluster aufgeteilt gespeichert ist, in den gemeinsamen Speicher 5 einen Befehl für jeden der Nebenprozessoren 3a-3d einzu schreiben, der einen Inhalt der Verarbeitung, eine Seitenzahl und so weiter umfaßt, über die Unterbrechungs-Signalleitungen 9a-9d nach einander jeden der Nebenprozessoren 3a-3d zu unterbrechen und um jeden der Nebenprozessoren 3a-3d von dem Vorhandensein einer durchzuführenden Verarbeitung zu informieren. Jeder der Neben prozessoren 3a-3d arbeitet dann in der Weise, daß er aus dem gemeinsamen Speicher 5 einen an sich selbst gerichteten Befehl liest, auf eine in diesem Befehl enthaltene Seitenzahl Bezug nimmt und eine relevante Seite aus jeder der Platteneinheit 4a-4d ausliest. Dieses Auslesen und Verarbeiten einer Seite aus diesen Nebenplatteneinheiten 4a-4d kann seitens der Nebenprozessoren 3a-3d parallel durchgeführt werden. Nach Beendigung einer derartigen Ver arbeitung schreibt jeder der Nebenprozessoren die Verarbeitungsergebnisse in den gemeinsamen Speicher 5 und unterbricht den Hauptprozessor 1 über die Unterbrechungs-Signalleitungen 9a-9d, um die Beendigung der Verarbeitung mitzuteilen. Nachdem alle Nebenprozessoren 3a-3d das Unter brechungssignal abgegeben haben, liest der Hauptprozessor 1 alle Verarbeitungsergebnisse aus dem gemeinsamen Speicher 5 aus und leitet diese Ergebnisse zu einem anderen Computer oder einem externen Terminal über die Eingangs-/Aus gangsleitung 10 weiter.

Anhand der Beschreibung ist ersichtlich, daß die Aufgabe der Erfindung wirksam gelöst ist und obwohl die Anzahl der Bauteile wie Nebenprozessor 3a-3d, Nebenplatteneinheit 4a-4d, lokale Speicher 7a-7d, lokale Busleitungen 8a-8d und Unterbrechungssignalleitungen 9a-9d gemäß dem bevorzugten Ausführungsbeispiel der Erfindung jeweils vier ist, ist es selbstverständlich, daß auch andere Zahlen vorhanden sein können.

Obwohl zu dem Hauptprozessor 1 und zu jedem Nebenprozessor 3a-3d eine Hauptplatten einheit 2 und jeweils eine Nebenplatteneinheit 4a-4d vorgesehen sind, ist es selbstverständlich, daß auch zwei oder mehrere zugeordnet sein können.

Claims

Datenverarbeitungsvorrichtung für ein relationales Datenbanksystem, bestehend aus
- - einem Hauptprozessor (1),
- - einem mit dem Hauptprozessor (1) verbundenen Hauptplattenspeicher (2), der in Form einer B- Baum-Struktur Clusterindizes für Attribute oder für eine Kombination von Attributen einer in dem relationalen Datenbanksystem zu verarbeitenden Relation speichert,
- - einer Mehrzahl von Nebenprozessoren (3a bis 3d), die von dem Hauptprozessor (1) gesteuert werden, und einer Mehrzahl von jeweils mit den jeweili gen Nebenprozessoren (3a bis 3d) verbundenen Nebenplattenspeichern (4a bis 4d), die aufge spalten eine Relation des Datenbanksystems spei chern, wobei die Relation auf der Grundlage ei ner Seite für einen Clusterindex in der Weise unterteilt ist, daß die Nebenprozessoren (3a bis 3d) parallel eine Vielzahl von Verarbeitungen an einer Gruppe von Tupeln, wie sie in ihrem Be reich in Zusammenhang mit einem gegebenen Schlüsselwert des Clusterindex definiert sind, durchführen,
wobei, wenn eine Seite vollständig mit einer Vielzahl von Tupeln der Relation gefüllt wird, zur Speicherung der die Clusterindizes aufweisenden Relation die Sei te in einem der Nebenplattenspeicher (4a bis 4d) in zwei Hälften teilbar ist und die eine Hälfte der so geteilten Seite in demjenigen der Nebenplattenspei cher (4a bis 4d) speicherbar ist, der gegenwärtig die kleinste Anzahl von die Tupel der Relation enthalten den Seiten aufweist.