DE102005061819B3 - Method for reducing a data record - Google Patents

Method for reducing a data record Download PDF

Info

Publication number
DE102005061819B3
DE102005061819B3 DE200510061819 DE102005061819A DE102005061819B3 DE 102005061819 B3 DE102005061819 B3 DE 102005061819B3 DE 200510061819 DE200510061819 DE 200510061819 DE 102005061819 A DE102005061819 A DE 102005061819A DE 102005061819 B3 DE102005061819 B3 DE 102005061819B3
Authority
DE
Germany
Prior art keywords
values
value
sum
sub
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE200510061819
Other languages
German (de)
Inventor
Manfred Wozny
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE200510061819 priority Critical patent/DE102005061819B3/en
Priority to PCT/EP2006/011252 priority patent/WO2007079819A1/en
Application granted granted Critical
Publication of DE102005061819B3 publication Critical patent/DE102005061819B3/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • G01N30/724Nebulising, aerosol formation or ionisation
    • G01N30/7266Nebulising, aerosol formation or ionisation by electric field, e.g. electrospray
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8603Signal analysis with integration or differentiation
    • G01N30/8617Filtering, e.g. Fourier filtering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8696Details of Software

Abstract

Ein Computerverfahren zur Reduktion eines Datensatzes, der aus N (n+1)-Tupeln (x<SUB>1alpha</SUB>, x<SUB>2alpha</SUB>, ..., x<SUB>nalpha</SUB>, y<SUB>alpha</SUB>) besteht, wobei alpha = 1, 2, ..., N gilt und n mindestens 2 beträgt, weist die folgenden Schritte auf: a) Erstellen eines ersten Summendatensatzes dadurch, dass die y-Werte der Tupel ersetzt werden durch die Summen der y-Werte derjenigen Tupel, deren x<SUB>1</SUB>-Werte in einem Intervall um den x<SUB>1</SUB>-Wert des ursprünglichen Tupels liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der x<SUB>1</SUB>-Dimension entsprechen, b) Erstellen eines zweiten Summendatensatzes dadurch, dass die y-Werte der Tupel des in a) erhaltenen ersten Summendatensatzes ersetzt werden durch die Summen der y-Werte derjenigen Tupel, deren x<SUB>2</SUB>-Werte in einem Intervall um den x<SUB>2</SUB>-Wert des ursprünglichen Tupels des ersten Summendatensatzes liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der x<SUB>2</SUB>-Dimension entsprechen, c) Für alle n > 2, falls vorhanden: Erstellen eines n-ten Summendatensatzes dadurch, dass die y-Werte der Tupel des in b) erhaltenen n-1 -ten Summendatensatzes ersetzt werden durch die y-Werte derjenigen Tupel, deren x<SUB>n</SUB>-Werte in einem Intervall um den x<SUB>n</SUB>-Wert des ursprünglichen Tupels des n-1 -ten Summendatensatzes liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der x<SUB>n</SUB>-Dimension entsprechen, d) Ermitteln mindestens ...A computer method for the reduction of a data set consisting of N (n + 1) tuples (x <SUB> 1alpha </SUB>, x <SUB> 2alpha </SUB>, ..., x <SUB> nalpha </ SUB >, y <SUB> alpha </SUB>), where alpha = 1, 2, ..., N and n is at least 2, has the following steps: a) Creation of a first total data record by the y Values of the tuples are replaced by the sums of the y values of those tuples whose x <SUB> 1 </SUB> values lie in an interval around the x <SUB> 1 </SUB> value of the original tuple, where the intervals are chosen so that their widths correspond to the width of characteristic signals in the x <SUB> 1 </SUB> dimension, b) creating a second sum data set by using the y values of the tuples of the first sum data set obtained in a) are replaced by the sums of the y values of those tuples whose x <SUB> 2 </SUB> values lie in an interval around the x <SUB> 2 </SUB> value of the original tuple of the first sum data record, whereby the Intervals so ge are selected so that their widths correspond to the width of characteristic signals in the x <SUB> 2 </SUB> dimension, c) For all n> 2, if available: Create an nth sum data record by using the y values of the Tuples of the n-1 th sum data record obtained in b) are replaced by the y values of those tuples whose x <SUB> n </SUB> values are in an interval around the x <SUB> n </SUB> value of the original tuple of the n-1 th sum data set, the intervals being chosen so that their widths correspond to the width of characteristic signals in the x <SUB> n </SUB> dimension, d) Determine at least ...

Description

Die vorliegende Erfindung betrifft allgemein das Gebiet der Reduktion der Datenmenge von Datensätzen wobei der Verlust an relevanter Information weitgehend vermieden wird.The The present invention relates generally to the field of reduction the dataset of records while largely avoiding the loss of relevant information becomes.

Insbesondere betrifft die vorliegende Erfindung ein Verfahren zur Reduktion von Datensätzen, ein Computerprogramm, das in Verbindung mit einem Computer das erfindungsgemäße Verfahren ausführt, sowie ein entsprechendes Computerprogramm, das auf einem computerlesbaren Medium gespeichert ist.Especially The present invention relates to a process for the reduction of Records a computer program which, in conjunction with a computer, the inventive method executing, as well as a corresponding computer program on a computer readable Medium is stored.

Die Größe von Datensätzen spielt bei deren Bearbeitung mit dem Computer eine entscheidende Rolle. Die zunehmende Größe von Datensätzen verlängert die Bearbeitungsdauer und erhöht die Anforderungen an die Systemressourcen. So werden beispielsweise größere Speichermedien, ein verbessertes Speichermanagement sowie gesteigerte Prozessorenleistungen erforderlich. Somit verursachen große Datenmengen einen oft exponentiell ansteigenden Kostenaufwand und zudem einen erhöhten Zeitaufwand und machen so häufig die Bearbeitung dieser großen Datensätze mit dem Durchschnitts-PC unmöglich.The Size of records plays in their processing with the computer a crucial role. The increasing the size of records prolongs the Processing time and increased the demands on the system resources. For example larger storage media, improved memory management and increased processor performance required. Thus, large amounts of data often cause you to exponentially Increasing cost and also an increased amount of time and make so often the editing of this great records impossible with the average PC.

Ein Weg, diesen Problemen zu begegnen, ist es. die Größe der anfallenden Datensätze zu reduzieren.One Way to face these problems is it. the size of the accruing records to reduce.

Ein Gebiet, das hier lediglich beispielgebend näher erläutert werden soll und auf dem Probleme mit der anfallenden großen Datenmenge häufig auftreten, ist die Auswertung von Datensätzen von gekoppelten Chromatographie-Massenspektroskopie-Experimenten.One Area, which will be explained here by way of example only and on the Problems with the accumulating large amount of data often occur is the evaluation of records coupled chromatography-mass spectroscopy experiments.

Hierbei wird eine zu untersuchende Probe zunächst chromatographisch in einer Säule aufgetrennt, bevor die einzelnen Probenbestandteile massenspektroskopisch analysiert werden.in this connection is a sample to be examined first chromatographically in a Column separated, before the individual sample components are analyzed by mass spectroscopy become.

Im Fall von LC-MS, d. h. Flüssigchromatographie-Massenspektrometrie(Liquid Chromatography – Mass Spectroscopy)-Experimenten, wird der massenspektroskopische Teil der Analyse oft mit der Elektrospray-Massenspektroskopie durchgeführt. Hierbei entstehen Datensätze, die in der Regel einen Umfang von einigen hundert Megabytes bis zu mehr als einem Gigabyte aufweisen.in the Case of LC-MS, d. H. Liquid Chromatography Mass Spectrometry (Liquid Chromatography - Mass Spectroscopy) experiments, becomes the mass spectroscopic part The analysis is often done with electrospray mass spectrometry. in this connection create records, which usually amounts to a few hundred megabytes to have more than a gigabyte.

Diese Größe der Datensätze ist problematisch sowohl im Hinblick auf die Auswertung als auch im Hinblick auf die Archivierung.These Size of the records is problematic both in terms of the evaluation and in the With regard to archiving.

Im Stand der Technik sind beispielsweise folgende Verfahren bekannt, die Größe von LC-MS-Datensätzen zu reduzieren:
Einerseits ist es möglich, die Detektionsempfindlichkeit des massenspektrometrischen Schritts zu reduzieren. Bei den häufig verwendeten MCP (Microchannelplate)-Detektoren kann dies dadurch erreicht werden, dass die MCP-Spannung vermindert wird. Mit dieser Maßnahme kann der Umfang der Datensätze beliebig reduziert werden. Allerdings hat diese Reduktion zur Folge, dass sehr schwache Signale nicht mehr detektiert werden oder dass der massenspektroskopische Response-Faktor – das Verhältnis der Intensität des massenspektroskopischen Signals zur Konzentration des Analyten in der Probe – mit abnehmender Analyt-Konzentration abnimmt und gegen Null strebt. Durch dieses Verhalten ist die zuverlässige Quantifizierung kleiner Signale nicht mehr sichergestellt. Dies stellt insbesondere bei vergleichenden Studien rekombinanter therapeutischer Proteine, sogenannten Comparability-Studien, einen entscheidenden Nachteil dar, da das Ziel solcher Studien darin besteht, die Anwesenheit nicht erwarteter Signale mit möglichst großer Zuverlässigkeit ausschließen zu können.
In the prior art, for example, the following methods are known for reducing the size of LC-MS data sets:
On the one hand, it is possible to reduce the detection sensitivity of the mass spectrometric step. For the commonly used MCP (microchannel plate) detectors, this can be achieved by reducing the MCP voltage. With this measure, the scope of the data sets can be arbitrarily reduced. However, this reduction has the consequence that very weak signals are no longer detected or that the mass spectroscopic response factor - the ratio of the intensity of the mass spectral signal to the concentration of the analyte in the sample - decreases with decreasing analyte concentration and tends to zero. This behavior no longer ensures reliable quantification of small signals. This represents a decisive disadvantage, especially in comparative studies of recombinant therapeutic proteins, so-called comparability studies, since the aim of such studies is to be able to exclude the presence of unexpected signals with the greatest possible reliability.

Weiterhin kann ein so genannter Cutoff-Wert bei der Datenaufnahme der Massenspektren verwendet werden. Bei diesem Verfahren handelt es sich ebenfalls um ein Verfahren, mit dem die Datensätze schon bei der Aufnahme der Daten in Ihrem Umfang beschränkt werden. Die Reduktion kommt dabei dadurch zustande, dass Signale unterhalb des Cutoff-Wertes nicht aufgezeichnet werden. Der Nach teil dieses Verfahrens besteht darin, dass der richtige Cutoff-Wert im Voraus nur schwer festzulegen ist, und in der Regel nicht derselbe Wert für alle Einzelspektren geeignet ist. Der letzte Punkt ist deshalb von Bedeutung, weil der Umfang unspezifischer Signale insbesondere durch das Vorhandensein von Analyt-Ionen hoher Konzentration signifikant erhöht wird.Farther can be a so-called cut-off value in the data acquisition of the mass spectra be used. This procedure is the same a method that records with the record limited in scope become. The reduction comes from the fact that signals not recorded below the cutoff value. The disadvantage This method is that the correct cutoff value in the Difficult to determine in advance, and usually not the same Value for all individual spectra is suitable. The last point is therefore from Meaning, because the scope of nonspecific signals in particular by the presence of analyte ions of high concentration significantly is increased.

Schließlich können Rauschsignale durch die statistische Analyse einzelner Massenspektren entfernt werden. Ein solches Verfahren ist beispielsweise in der Patentanmeldung WO 2005031791 beschrieben. Hierbei werden einzelne Massenspektren statistisch mit dem Ziel analysiert, unspezifische, d.h. dem Rauschen zuzuordnende Signale zu identifizieren, um diese Signale aus den Spektren zu entfernen. Ein ähnliches Verfahren ist auch in der unter dem Markennamen MassMap® (www.massmap.bregler.org) vertriebenen Software zur Auswertung von LC-MS-Datensätzen implementiert. Im Fall von MassMap® erfolgt keine Speicherung der Spektren, aus denen die Rauschsignale entfernt wurden. Die Software stellt eine Routine zur Verfügung, mit der Total-Ionenstrom-Chromatogramme berechnet werden, bei denen die dem Rauschen zugeordneten Signale nicht berücksichtigt werden. Mit der Entfernung von Peaks, die den Rauschsignalen zuzuordnen sind und wie sie anhand von statistischen Analysen einzelner Spektren identifiziert werden, werden eine Reduktion des Umfangs von LC-MS-Datensätzen und eine Verbesserung des Signal/Rausch-Verhältnisses von Total-Ionenstrom-Chromatogrammen erreicht. Allerdings führt die Betrachtung der Einzelspektren bei Signalen an der Nachweisgrenze dazu, dass auch bei diesem Verfahren viele Signale, die von Analyten stammen, fälschlicherweise dem Rauschen zugeordnet werden. Im Ergebnis resultiert auch hier ein Sensitivitätsverlust.Finally, noise signals can be removed by statistical analysis of individual mass spectra. Such a method is described for example in the patent application WO 2005031791. Here, individual mass spectra are analyzed statistically with the aim of identifying non-specific, ie the noise attributable signals to remove these signals from the spectra. A similar procedure ren is also implemented in the under the brand name MassMap ® (www.massmap.bregler.org) available software for the analysis of LC-MS data sets. In the case of MassMap ® does not store the spectra from which the noise signals are removed done. The software provides a routine for calculating total ion current chromatograms that do not take into account the signals associated with noise. With the removal of peaks attributable to the noise signals and identified by statistical analyzes of individual spectra, a reduction in the amount of LC-MS data sets and an improvement in the signal-to-noise ratio of total ion current chromatograms are achieved , However, the consideration of the single spectra for signals at the detection limit means that also in this method, many signals that originate from analytes are erroneously assigned to the noise. As a result, a loss of sensitivity also results here.

Nachteilig an all diesen Verfahren ist es somit, dass obwohl Signale, die den Analyten entsprechen, an der Nachweisgrenze noch zuverlässig detektierbar sind, die erwähnten Verfahren diese Signale in einzelnen Massenspektren als Rauschsignale fehlidentifizieren.adversely In all of these methods, it is thus that, although signals carrying the Analytes correspond, at the detection limit still reliably detectable are the ones mentioned Process these signals in single mass spectra as noise signals mis-identify.

In der Konsequenz führen diese Verfahren so zu einer Verminderung der Detektierbarkeit von Signalen an der Nachweisgrenze.In to lead the consequence These methods thus reduce the detectability of Signals at the detection limit.

Die Druckschrift US 3,800,236 beschreibt eine Schaltungsanordnung zum Kompensieren einer driftenden Grundlinie (Nulllinie) eines zu messenden Eingangssignals, das aus aufeinander folgenden Peaks besteht. Die Schaltungsanordnung weist auf: einen Peakdetektor, der einen Integrierer, der die Signalvariationen über aufeinander folgende kurze Messintervalle integriert und nach jedem Messintervall auf Null zurücksetzbar ist, und außerdem einen Vergleicher enthält, durch den der Ausgang des Integrierers mit einem speziellen Bezugssignal verglichen wird und der ein Peakerkennungssignal zur Verfügung stellt, wenn der Ausgang des Integrierers das Bezugssignal während eines Messintervalls überschreitet; einen Zähler, in dem Pulse bei einer Abweichung des Eingangssignals von Null gezählt werden können, einen Digital/Analog-Wandler, durch den das Ausleseergebnis des Zählers in ein analoges Korrektursignal gewandelt werden kann, das algebraisch von dem Eingangssignal zur Nulllinienkorrektur subtrahiert wird, und eine Einrichtung zum Steuern des Zählbetriebes in Abhängigkeit von dem Peakerkennungssignal des Peakdetektors derart, dass beim Bestimmen des Vorhandenseins eines Peaks in dem Eingangssignal die Nulllinienkompensation angehalten wird.The publication US 3,800,236 describes a circuit arrangement for compensating a drifting baseline (zero line) of an input signal to be measured which consists of successive peaks. The circuit includes: a peak detector including an integrator that integrates the signal variations over successive short measurement intervals and is reset to zero after each measurement interval, and also includes a comparator that compares the output of the integrator to a particular reference signal; provides a peak detection signal when the output of the integrator exceeds the reference signal during a measurement interval; a counter in which pulses can be counted at a deviation of the input signal from zero, a digital / analog converter, by which the readout result of the counter can be converted into an analog correction signal that is algebraically subtracted from the input signal to the zero line correction, and a Means for controlling the count operation in response to the peak detection signal of the peak detector such that in determining the presence of a peak in the input signal, the zero line compensation is stopped.

Die Druckschrift US 5,995,989 A beschreibt ein Verfahren zum Komprimieren und Filtern von Spektroskopiedaten. Das Verfahren dient zum Erkennen von Peaks und Filterdaten, die Hintergrundrauschen betreffen, wodurch das Datenvolumen verringert wird. Das Verfahren überwacht den Wert eines jeweiligen Datenpunkts und vergleicht diesen mit vorherigen Daten, um zu bestimmen, ob dieser Datenpunkt sich auf oder in der Nähe eines Peaks befindet. Die y-Werte für jeden Datenpunkt werden kontinuierlich aufsummiert und gemittelt, um den mittleren Hintergrundpegel zu bestimmen. Die Abweichung wird für jeden folgenden Datenpunkt bestimmt und verwendet, um einen Schwellenwert zu bestimmen. Jeder folgende Datenpunkt wird mit dem Schwellenwert verglichen, und wenn dieser oberhalb des Schwellenwertes ist, wird angenommen, dass er Teil eines Peaks ist oder sich in der Nähe davon befindet. Zu diesem Zeitpunkt wird die Mittelung angehalten, bis ein folgender Datenpunkt unterhalb des Schwellenwertes liegt. Nach der Erfassung sämtlicher Peaks können Daten, die das Hintergrundrauschen betreffen, weggelassen werden.The publication US 5,995,989 A describes a method for compressing and filtering spectroscopy data. The method is for detecting peaks and filter data related to background noise, thereby reducing the data volume. The method monitors the value of each data point and compares it to previous data to determine if that data point is at or near a peak. The y values for each data point are continuously summed and averaged to determine the average background level. The deviation is determined for each subsequent data point and used to determine a threshold. Each subsequent data point is compared to the threshold, and if it is above the threshold, it is assumed to be part of or near a peak. At this time, averaging is paused until a subsequent data point is below the threshold. After acquiring all the peaks, data concerning the background noise may be omitted.

Bei den Verfahren gemäß der beiden zuletzt genannten Druckschriften ist es jedoch nicht möglich, kleine Peaks, die in den Bereich unterhalb des Schwellenwertes fallen, zu erkennen, so dass auch diese entfernt werden und somit wesentliche Information durch die Datenreduktion verloren geht.at the method according to the two last mentioned pamphlets, however, it is not possible, small Peaks that fall within the range below the threshold, so that they too are removed and thus essential Information lost through data reduction.

Ausgehend vom Stand der Technik war es daher Aufgabe der vorliegenden Erfindung, ein Verfahren zur Reduktion von Datensätzen zur Verfügung zu stellen, bei der die Erkennbarkeit von Signalen an der Nachweisgrenze so wenig wie möglich vermindert wird.outgoing The object of the present invention was therefore to provide a method for the reduction of records available in which the detectability of signals at the detection limit as little as possible is reduced.

Insbesondere war es Aufgabe der vorliegenden Erfindung, ein dementsprechendes Verfahren zur Reduktion von Chromatographie-Massenspektroskopie-Datensätzen, ein Computerprogramm, das in Verbindung mit einem Computer oder einem Computersystem dieses Verfahren ausführt, sowie ein entsprechendes Computerprogramm, das auf einem computerlesbaren Medium gespeichert ist, zur Verfügung zu stellen.Especially It was an object of the present invention, a corresponding Method for reducing chromatography-mass spectrometry data sets Computer program that works in conjunction with a computer or a computer Computer system performs this method, and a corresponding computer program, which is stored on a computer readable medium available to put.

Diese Aufgabe wird durch ein Verfahren zur Reduktion von Datensätzen gemäß Anspruch 1 oder 2, durch ein Computerprogramm nach Anspruch 14, das in Verbindung mit einem Computer das erfindungsgemäße Verfahren ausführt, sowie durch ein Computerprogramm nach Anspruch 15, das auf einem computerlesbaren Medium gespeichert ist, gelöst.These The object is achieved by a method for the reduction of data sets as claimed 1 or 2, by a computer program according to claim 14, in connection with a computer performs the method according to the invention, as well as by a computer program according to claim 15, which is on a computer readable Medium is stored, solved.

Überraschenderweise hat der Erfinder der vorliegenden Erfindung herausgefunden, dass wenn man bei der statistischen Analyse einzelner Datensätze statt der einzelnen Datenaufnahmevorgänge, beispielsweise Scans, Summen mehrerer einzelner Datenaufnahmevorgänge verwendet, die Signale an der Nachweisgrenze nicht mehr fälschlicherweise dem Rauschen zugeordnet werden, sondern als relevante Signale erkannt werden.Surprisingly the inventor of the present invention has found that if you take the statistical analysis of individual records the individual data acquisition processes, for example, using scans, sums of multiple individual data collections, the signals at the detection limit no longer falsely mimic the noise but are recognized as relevant signals.

Somit kam der Erfinder zu dem Resultat, dass man mit dem erfindungsgemäßen Verfahren letztendlich zu einem genaueren Ergebnis gelangt, obwohl man sum mierte Scans statt Einzelscans statistisch analysiert, und somit die absoluten Signalwerte und die Meßfehler summiert.Consequently the inventor came to the conclusion that with the method according to the invention ultimately reached a more accurate result, even though they sum Scans instead of individual scans analyzed statistically, and thus the absolute Signal values and the measurement errors summed.

Neben diesen Eigenschaften unterscheidet sich das erfindungsgemäße Verfahren auch durch einige weitere Aspekte vom beispielsweise in der Patentanmeldung WO 2005031791 offenbarten Stand der Technik.Next these properties, the method of the invention differs also by some further aspects of for example in the patent application WO 2005031791 disclosed prior art.

Im Unterschied zu dem Verfahren des Standes der Technik kommt das erfindungsgemäße Verfahren ohne einen Extraschritt zur Identifizierung von Peaks aus. Dies ermöglicht eine schnellere Datenverarbeitung und schont Systemressourcen.in the Difference to the method of the prior art, the inventive method comes without an extra step to identify peaks. This allows a faster data processing and protects system resources.

Das erfindungsgemäße Verfahren benötigt ferner im Gegensatz zu dem in der Druckschrift WO 2005031791 offenbarten Verfahren keinerlei Voraussetzungen hinsichtlich der Struktur des Rauschens, während in der WO 2005031791 z.B. im Fall von Tof-Spektren eine Poisson-Verteilung angenommen wird.The inventive method needed further in contrast to that disclosed in document WO 2005031791 Procedure has no prerequisites regarding the structure of the Noise while in WO 2005031791 e.g. in the case of Tof spectra a Poisson distribution Is accepted.

Schließlich kann die Berechnung des Mittelwerts und der Standardabweichung als statistische Momente beim erfindungsgemäßen Verfahren beispielsweise nur für Datenpunkte mit von Null verschiedenen Intensitätswerten erfolgen.Finally, can the calculation of the mean and standard deviation as statistical Moments in the method according to the invention for example, only for Data points with non-zero intensity values occur.

Weiterhin hat der Erfinder überraschenderweise herausgefunden, dass die selektive Erkennung unspezifischer Peaks, wie beispielsweise Rauschpeaks, weiter verbessert wird, wenn die einzelnen Scans so summiert werden, dass sich die jeweils zu addierenden Scans an der Breite eines charakteristischen Signals orientieren.Farther the inventor has surprisingly found that the selective detection of nonspecific peaks, such as noise peaks, is further enhanced when the individual scans are summed up so that the one to be added Orient scans to the width of a characteristic signal.

Ein solches charakteristisches Signal ist beispielsweise ein Messsignal, das in der Dimension, in der es gemessen wurde, einen bestimmten Teil oder eine bestimmte Eigenschaft des gemessenen Objekts, beispielsweise einer Probensubstanz oder einer zu beobachtenden Anordnung genauer beschreibt.One such a characteristic signal is for example a measuring signal, that in the dimension in which it was measured, a particular one Part or a specific property of the measured object, for example a sample substance or an array to be observed more accurately describes.

Somit umfasst die vorliegende Erfindung ein Verfahren zur Reduktion eines Datensatzes, der aus N (n+1)-Tupeln (x, x, ... x, yα) besteht, wobei α=1, 2, ..., N gilt und n mindestens 2 beträgt, wobei das Computerverfahren die folgenden Schritte aufweist:

  • a) Erstellen eines ersten Summendatensatzes dadurch, dass die y-Werte der Tupel ersetzt werden durch die Summen der y-Werte derjenigen Tupel, deren x1-Werte in einem Intervall um den x1-Wert des ursprünglichen Tupels liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der x1-Dimension entsprechen,
  • b) Erstellen eines zweiten Summendatensatzes dadurch, dass die y-Werte der Tupel des in a) erhaltenen ersten Summendatensatzes ersetzt werden durch die Summen der y-Werte derjenigen Tupel, deren x2-Werte in einem Intervall um den x2-Wert des ursprünglichen Tupels des ersten Summendatensatzes liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der x2-Dimension entsprechen,
  • c) Für alle n > 2, falls vorhanden: Erstellen eines n-ten Summendatensatzes dadurch, dass die y-Werte der Tupel des in b) erhaltenen n-1-ten Summendatensatzes ersetzt werden durch die y-Werte derjenigen Tupel, deren xn-Werte in einem Intervall um den xn-Wert des ursprünglichen Tupels des n-1-ten Summendatensatzes liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der xn-Dimension entsprechen,
  • d) Ermitteln mindestens eines jeweiligen ersten statistischen Parameters des jeweiligen n-ten Summendatensatzes aus Schritt b) oder c),
  • e) Ermitteln eines jeweiligen Schwellenwertes für die y-Werte aus dem jeweiligen ersten statistischen Parameter,
  • f) Vergleichen der y-Werte des n-ten Summendatensatzes mit dem jeweiligen Schwellenwert,
  • g) Erzeugen eines reduzierten Datensatzes durch Entfernen aller Tupel des zu reduzierenden Datensatzes, deren entsprechender y-Wert im n-ten Summendatensatz aus Schritt b) oder c) nicht größer als der Schwellenwert ist.
Thus, the present invention includes a method of reducing a data set consisting of N (n + 1) tuples (x , x , ... x , ), where α = 1, 2, ... , N and n is at least 2, the computer method comprising the following steps:
  • a) Creating a first sum data set by replacing the y-values of the tuples with the sums of the y-values of those tuples whose x 1 values lie at an interval around the x 1 value of the original tuple are chosen so that their widths correspond to the width of characteristic signals in the x 1 dimension,
  • b) generating a second sum data set by replacing the y values of the tuples of the first sum data set obtained in a) by the sums of the y values of those tuples whose x 2 values are in an interval around the x 2 value of the original one Lie tuples of the first summation data set, wherein the intervals are chosen such that their widths correspond to the width of characteristic signals in the x 2 dimension,
  • c) For all n> 2, if available: Creation of an nth sum data set by replacing the y values of the tuples of the n-1th sum data set obtained in b) with the y values of those tuples whose x n Values lie at an interval around the x n value of the original tuple of the n-th summation dataset, the intervals being chosen such that their widths correspond to the width of characteristic signals in the x n dimension,
  • d) determining at least one respective first statistical parameter of the respective nth summation data record from step b) or c),
  • e) determining a respective threshold value for the y values from the respective first statistical parameter,
  • f) comparing the y values of the nth sum data record with the respective threshold value,
  • g) generating a reduced data set by removing all tuples of the data set to be reduced whose corresponding y value in the nth sum data record from step b) or c) is not greater than the threshold value.

Optional können auch in Schritt g) zunächst alle y-Werte des zu reduzierenden Datensatzes auf Null gesetzt werden, deren entsprechender Wert im n-ten Summendatensatz aus Schritt b) oder c) nicht größer als der jeweilige Schwellenwert ist.optional can also in step g) first all y-values of the record to be reduced are set to zero, their corresponding value in the nth summation dataset from step b) or c) not greater than that respective threshold is.

Danach wird dann durch Entfernen der Tupel, deren y-Werte im vorhergehenden Schritt auf Null gesetzt wurden, ein reduzierter Datensatz erstellt.After that is then done by removing the tuples whose y values are in the previous one Step were set to zero, a reduced record created.

Beispielsweise bei zeitabhängigen Bildverarbeitungs-Anwendungen ist ein solches Verfahren nützlich und reduziert die erforderliche Speichermenge ohne Qualitätsverlust und verbessert zusätzlich die Bildqualität durch den Wegfall von Rauschsignalen.For example at time-dependent Image processing applications, such a process is useful and reduces the required storage volume without quality loss and improves additionally the picture quality through the elimination of noise signals.

Besonders geeignet ist ein solches Verfahren beispielsweise, wenn Veränderungen von bekannten Objekten im Laufe der Zeit überwacht werden sollen. Denkbar ist eine Anwendung des erfindungsgemäßen Verfahrens somit unter anderem bei der Datensicherung bei Kamera-gestützen Überwachungssystemen.Especially such a method is suitable, for example, if changes to be monitored by known objects over time. Conceivable is an application of the method thus under in the backup of camera-based surveillance systems.

Bei Chromatographie-Massenspektroskopie-Analyseverfahren wird ein zusätzlicher Gewinn an Selektivität mit dem erfindungsgemäßen Verfahren dadurch erreicht, dass die Bewertung der Signale der summierten Massenspektren anhand von Summen erfolgt, die sich über m/z-Bereiche erstrecken, die der erwarteten Breite massenspektrometrischer Signale entsprechen.at Chromatography-mass spectrometry analysis method becomes an additional Gain in selectivity with the method according to the invention achieved in that the evaluation of the signals of the summed Mass spectra are based on sums that span m / z ranges extend the expected width of mass spectrometric signals correspond.

Hierbei können beliebige chromatographische Verfahren, wie beispielsweise Flüssigkeitschromatographie, Kapillarelektrophorese oder Gaschromatographie mit beliebigen geeigneten massenspektroskopischen Verfahren, wie z.B. Elektrospray-, Elektronenstoß-Ionisation-, Kollisions-Aktivierungs-, oder Neutralisations-Reionisierungs-MS kombiniert werden.in this connection can any chromatographic method, such as liquid chromatography, Capillary electrophoresis or gas chromatography with any suitable mass spectroscopic methods, e.g. Electrospray, Electron Impact Ionization, Collision Activation, or Neutralization Reionization MS be combined.

Somit ist eine Ausführungsform der vorliegenden Erfindung ein Verfahren zur Reduktion von beispielsweise Flüssigchromatographie-Massenspektroskopie-Datensätzen durch Entfernen unspezifischer Signale aus den Datensätzen, die aus N Massenspektren Mα bestehen, die während der Erstellung der Datensätze zu aufeinander folgenden Zeiten tα aufgenommen werden und die jeweils nα Wertepaare (xαj, yαj) aufweisen, wobei die xαj die m/z-Werte und die yαj die Intensitätswerte darstellen und α ∊ {1, 2, ..., N} sowie j ∊ {1, 2, ..., nα} gilt, wobei das Verfahren die folgenden Schritte aufweist:

  • a) für α ∊ {1, ...N} Summieren von einzelnen Massenspektren aus der Gesamtheit der Massenspektren einschließlich Mα, die innerhalb eines tα einschließenden Zeitintervalls Tα aufgenommen wurden, zu jeweiligen ersten Summenmassenspektren M'α bestehend aus n'α Wertepaaren (x'αk, y'αk), wobei k ∊ {1,2, ..,n'α} gilt, und die Breite der Zeitintervalle Tα in Abhängigkeit von der Breite von mindestens einem chromatographischen Peak im Zeitbereich um tα bestimmt wird,
  • b) für jedes x'αk eines jeweiligen ersten Summenmassenspektrums M'α Summieren der Werte y'αm, deren entsprechende Werte x'αm in einem m/z-Intervall X'αk um x'αk liegen, zu jeweiligen Summenwerten y''αk, um ein jeweiliges zweites Summenmassenspektrum M''α zu erhalten mit den Wertepaaren (x''αk=x'αk,y''αk), wobei das m/z-Intervall X'αk in Abhängigkeit von der Breite der entsprechenden massenspektrometrischen Peaks im Bereich um x'αk bestimmt wird,
  • c) Ermitteln mindestens eines jeweiligen ersten statistischen Parameters des jeweiligen zweiten Summenmassenspektrums M''α,
  • d) Ermitteln eines jeweiligen Schwellenwerts Yα aus dem jeweiligen ersten statistischen Parameter,
  • e) Vergleichen der Summenwerte y''αk mit dem jeweiligen Schwellenwert Yα,
  • f) Erzeugen eines jeweiligen reduzierten Datensatzes durch Entfernen der Wertepaare (xαj, yαj) der jeweiligen Massenspektren Mα, für die die entsprechenden Summenwerte y''αk nicht größer als der jeweilige Schwellenwert Yα sind, wobei x''αk = xαj gilt.
Thus, one embodiment of the present invention is a method of reducing, for example, liquid chromatography mass spectrometry data sets by removing nonspecific signals from the data sets consisting of N mass spectra M α taken during the generation of the data sets at successive times t α and each n α pairs of values (x αj , y αj ), where the x αj represent the m / z values and the y αj represent the intensity values and α ε {1, 2, ..., N} and j ε {1, 2, ..., n α }, the method comprising the following steps:
  • a) for α ε {1, ... N} summing individual mass spectra of the total of the mass spectra including M α taken α within a t α enclosing the time interval T to respective first sum mass spectra M consisting of n' α Value pairs (x ' αk , y' αk ), where k {1,2, .., n ' α }, and the width of the time intervals T α as a function of the width of at least one chromatographic peak in the time domain by t α it is determined
  • b) for each x ' αk of a respective first sum mass spectrum M' α summing the values y ' αm whose corresponding values x' αm lie in a m / z interval X ' αk by x' αk to respective sum values y " αk to obtain a respective second sum mass spectrum M '' α with the value pairs (x '' αk = x ' αk, y'' αk ), wherein the m / z interval X' αk depending on the width of the corresponding mass spectrometric peaks is determined in the range around x ' αk ,
  • c) determining at least one respective first statistical parameter of the respective second sum mass spectrum M " α ,
  • d) determining a respective threshold value Y α from the respective first statistical parameter,
  • e) comparing the sum values y '' αk with the respective threshold value Y α ,
  • f) generating a respective reduced data set by removing the value pairs (x αj , y αj ) of the respective mass spectra M α , for which the corresponding sum values y " αk are not greater than the respective threshold Y α , where x" αk = x αj holds.

Auch bei diesem Verfahren ist es wiederum möglich, den Schritt f) in zwei Teilschritte zu unterteilen, wobei in einem ersten Teilschritt die yαj-Werte der jeweiligen Massenspektren Mα, für die die entsprechenden Summenwerte y''αk nicht größer als der jeweilige Schwellenwert Yα sind, zu Null gesetzt werden. In einem zweiten Teilschritt werden diese Wertepaare mit den zu Null gesetzten yαj-Werten aus dem Datensatz entfernt.In this method, too, it is possible to subdivide step f) into two sub-steps, wherein in a first sub-step the y αj values of the respective mass spectra M α , for which the corresponding sum values y " αk are not greater than the respective threshold value Y α are set to zero. In a second sub-step, these value pairs are removed from the data set with the y αj values set to zero.

Entsprechend einer besonders bevorzugten Ausführungsform der Erfindung findet in Schritt a) eine gewichtete Summation statt, bei der die Gewichtung der zu summierenden Massenspektren Mβ eine mit dem Betrag |tα – tβ| des zeitlichen Abstands des Massenspektrums vom jeweiligen Massenspektrum Mα monoton abnehmende Funktion darstellt.According to a particularly preferred embodiment of the invention, a weighted summation takes place in step a), in which the weighting of the mass spectra M β to be summed takes place with the magnitude | t α -t β | represents the temporal distance of the mass spectrum of the respective mass spectrum M α monotonically decreasing function.

Unter monoton abnehmend wird verstanden, dass der Funktionswert mit größer werdendem x nicht größer wird, d.h., dass aus x1 < x2 folgt, dass f(x1) ≥ f(x2) ist.By decreasing monotonically, it is meant that the function value does not increase with increasing x becomes larger, that is, it follows from x 1 <x 2 that f (x 1 ) ≥ f (x 2 ).

Bevorzugt ist die Funktion streng abnehmend, d.h., dass aus x1 < x2 folgt, dass f(x1) > f(x2) ist.Preferably, the function is strictly decreasing, that is, it follows from x 1 <x 2 that f (x 1 )> f (x 2 ).

In einer weiteren bevorzugten Ausführungsform der Erfindung findet in Schritt b) eine gewichtete Summation der Intensitäten statt, bei der die Gewichtung der jeweiligen Werte y'αm eine mit dem Betrag |x'αm – x'αk| des Abstandes des jeweiligen Wertes x'αm von x'αk monoton abnehmende Funktion darstellt.In a further preferred embodiment of the invention, a weighted summation of the intensities takes place in step b), in which the weighting of the respective values y ' αm one with the magnitude | x' αm - x ' αk | represents the distance of the respective value x ' αm of x' αk monotonically decreasing function.

Auch hier ist eine streng monoton abnehmende Funktion wiederum besonders bevorzugt.Also Here again a strictly monotonically decreasing function is especially special prefers.

Bei einem erfindungsgemäßen Verfahren zur Reduktion von Datensätzen für Chromatographie-Massenspektroskopiedatensätze kann ferner der jeweilige Zeitbereich Tα so ausgewählt werden, dass er im Wesentlichen der vollen Breite auf halber Höhe (FWHM) der chromatographischen Peaks entspricht.In a method according to the invention for the reduction of data sets for chromatography-mass spectrometric data sets, the respective time range T α can furthermore be selected such that it corresponds essentially to the full width at half the height (FWHM) of the chromatographic peaks.

So kann die Scan-Summation jeweils optimal an ein vorhandenes Signal angepasst werden. Somit wird sichergestellt, dass sich die Anzahl der summierten Scans in sinnvoller Weise aus den Umständen ergibt, und dass nur die Scans in einem Teilbereich summiert werden, die sinnvollerweise eine gewisse Datenähnlichkeit erwarten lassen. In besonderer Weise wird durch diesen Schritt der Probenauftrennung in dem vorgeschalteten Chromatographieverfahren Rechnung getragen. Ergeben sich in dem Chromatogramm relativ breite Peaks, so wird bevorzugt auch nur über diese breiten Bereiche summiert, während, wenn die Chromatographie vorwiegend schmale Peaks liefert, auch nur über diese schmalen Bereiche summiert wird. Dies hat den Vorteil, dass die Massenspektren in den Bereichen summiert werden, die nach dem Chromatographieschritt einer größtenteils aufgereinigten Probenkomponente entsprechen.So The scan summation can optimally match an existing signal be adjusted. This ensures that the number the summed scans in a meaningful way out of the circumstances, and that only the scans are summed in one subarea, which makes sense a certain data similarity can be expected. In a special way, this step is the Sample separation in the upstream chromatography method Taken into account. If relatively wide peaks occur in the chromatogram, so is preferred only over These broad ranges are summed while, if the chromatography predominantly narrow peaks, even over these narrow areas will be summed up. This has the advantage that the mass spectra are summed in the areas that after the Chromatography step a largely correspond to purified sample component.

Ebenso kann in dem zweiten Summierungsschritt der Summierungsbereich Xαk so ausgewählt werden, dass er im Wesentlichen der vollen Breite auf halber Höhe (FWHM) der massenspektrometrischen Peaks im Summierungsbereich entspricht. Die hierbei für die Intervallgröße zu verwendende Peakbreite muss nicht vom jeweiligen Massenspektrum abhängen, sondern ist in der Regel eine Funktion des m/z- bzw. x-Werts. Die Peakbreite kann auf der Grundlage der Auflösung des Massenanalysators bestimmt werden. Sie kann entweder, wie im Fall von Ionenfallen und Quadrupolanalysatoren, weitgehend unabhängig vom m/z-Wert oder, wie im Fall von Tof-Analysatoren, direkt proportional zum m/z-Wert sein. Durch diese Auswahl des Summierungsbereichs Xαk wird vermieden, dass zu viele unspezifische Signale summiert werden, die aus peakfremden Bereichen stammen.Also, in the second summation the summation range αk X can be selected so that it is substantially the full width at half maximum (FWHM) corresponding to the mass spectrometric peak in the summation range. The peak width to be used for the interval size does not have to depend on the respective mass spectrum, but is generally a function of the m / z or x value. The peak width can be determined based on the resolution of the mass analyzer. It can either be largely independent of the m / z value or, as in the case of Tof analyzers, directly proportional to the m / z value, as in the case of ion traps and quadrupole analyzers. This selection of the summation range X αk avoids the accumulation of too many unspecific signals originating from non-peak regions.

Die Berechnung der statistischen Parameter der zweiten Summenmassenspektren erfolgt bevorzugt individuell für jedes einzelne Spektrum. Die gemeinsame Verwendung von statistischen Parametern für mehrere Spektren ist jedoch ebenfalls möglich.The Calculation of the statistical parameters of the second sum mass spectra is preferably done individually for every single spectrum. The common use of statistical Parameters for however, multiple spectra is also possible.

Die Ermittlung des Schwellenwerts Yα im Schritt d) weist in einer weiteren Ausführungsform die folgenden Schritte auf:

  • da) Ermitteln eines ersten Schwellenwerts Yα1 aus dem ersten statistischen Parameter,
  • db) Ermitteln mindestens eines zweiten statistischen Parameters für diejenigen Wertepaare des zweiten Summenmassenspektrums M''α, für die der Summenwert y''αk größer als der erste Schwellenwert Yα1 ist,
  • dc) Ermitteln eines zweiten Schwellenwerts Yα2 aus dem zweiten statistischen Parameter,
  • dd) Wiederholen der Schritte da) bis dc) bis der Betrag der Differenz zwischen dem ersten Schwellenwert Yα1 und dem zweiten Schwellenwert Yα2 einen vorbestimmten Grenzwert ΔY nicht mehr übersteigt.
The determination of the threshold value Y α in step d) comprises in a further embodiment the following steps:
  • da) determining a first threshold Y α1 from the first statistical parameter,
  • db) determining at least one second statistical parameter for those value pairs of the second sum mass spectrum M '' α , for which the sum value y '' αk is greater than the first threshold value Y α1 ,
  • dc) determining a second threshold Y α2 from the second statistical parameter,
  • dd) repeating steps da) to dc) until the magnitude of the difference between the first threshold Y α1 and the second threshold Y α2 no longer exceeds a predetermined threshold ΔY.

Solch ein Verfahren erlaubt es, dass der Schwellenwert jeweils automatisch für jedes Summenmassenspektrum optimal angepasst berechnet wird und nicht durch den Fachmann jeweils individuell festgelegt werden muss.Such A procedure allows the threshold to be set automatically for each Sum mass spectrum is calculated optimally adjusted and not must be determined individually by the skilled person.

Optional können die Schritte c) bis e) für den gesamten Wertepaarbereich des jeweiligen zweiten Summenmassenspektrums M''α durchgeführt werden.Optionally, the steps c) to e) can be carried out for the entire value pair range of the respective second sum mass spectrum M " α .

In einer Ausführungsform wird zur Durchführung der Schritte c) bis e) das jeweilige zweite Summenmassenspektrum M''α in Wertepaarteilbereiche Iακ mit

Figure 00140001
unterteilt, und die Schritte c) bis e) werden jeweils für einen Wertepaarteilbereich Iακ durchgeführt.In one embodiment, in order to carry out steps c) to e), the respective second sum mass spectrum M " α is included in value pair subareas I ακ
Figure 00140001
are divided, and the steps c) to e) are each performed for a Wertepaarteilbereich I ακ .

Hierdurch kann vorteilhafterweise der Wertepaarteilbereich in seiner Ausdehnung an die entsprechende Peakbreite angepasst werden, so dass entsprechend einer weiteren Ausführungsform bei der Bearbeitung von massenspektroskopischen Datensätzen der jeweilige Wertepaarteilbereich Iακ in Abhängigkeit von der Breite der massenspektrometrischen Peaks bestimmt wird.This advantageously makes it possible to adapt the range of value pairs in its extent to the corresponding peak width, so that, in accordance with a further embodiment, the respective value pair portion I ακ is determined as a function of the width of the mass spectrometric peaks when processing mass spectroscopic data sets.

In einer speziellen Ausführungsform werden die Wertepaarteilbereiche Iακ entsprechend den folgenden Gleichungen bestimmt:

Figure 00140002
Figure 00150001
wobei X(u)ακ die untere Grenze und X(o)ακ die obere Grenze des Wertepaarteilbereichs Iακ sind, β einen Faktor größer als 5 darstellt, und δ für die Breite des Summierungsbereichs X'ακ für m/z-Werte des Wertepaarbereichs Iακ steht.In a specific embodiment, the value pairs sections I ακ are determined according to the following equations:
Figure 00140002
Figure 00150001
in which X (U) ακ the lower limit and X (O) ακ the upper limit of the value pair increment I are ακ, β a factor greater than 5 is, and δ for the width of Summierungsbereichs X 'ακ for m / z values of the pair of values is the region I ακ.

Weiterhin können bei dem erfindungsgemäßen Verfahren im Schritt c) der Mittelwert MWα und die Standardabweichung SDα der von Null verschiedenen Intensitätswerte als statistische Parameter und im Schritt d) der Schwellenwert Yα entsprechend der Gleichung Yα = MWα + f(α)·SDα bestimmt werden, wobei f(α) einen Faktor darstellt, der bevorzugt in einem Bereich von 0,5 bis 5 rangiert und besonders bevorzugt 2 ist.Furthermore, in the method according to the invention in step c) the mean value MW α and the standard deviation SD α of the non-zero intensity values can be used as statistical parameters and in step d) the threshold value Y α according to the equation Y α = MW α + f (α) · SD α where f (α) represents a factor which preferably ranges from 0.5 to 5, and more preferably 2.

Es ist dem Fachmann jedoch klar, dass er je nach den Anforderungen an die Genauigkeit der Datenerfassung bzw. an die Größe der resultierenden Datensätze den Faktor f(α) jeweils individuell anpassen kann. Hierbei führt ein kleiner Faktor f(α) zu einer besseren Datenerfassung an der Nachweisgrenze, allerdings auch zu einer erhöhten Datenmenge.It However, it is clear to a person skilled in the art that he depends on the requirements to the accuracy of the data acquisition or to the size of the resulting records the factor f (α) each individually. Here, a small factor f (α) leads to a better data collection at the detection limit, but also too an elevated one Amount of data.

Es ist dem Fachmann ferner klar, dass sämtliche in dieser Erfindung offenbarte Ausführungsformen beliebig miteinander kombinierbar sind, ohne dass dadurch vom Umfang der vorliegenden Erfindung abgewichen wird.It It will be further understood by those skilled in the art that all in this invention disclosed embodiments as desired be combined with each other, without thereby by the scope of deviates from the present invention.

Losgelöst von spektroskopischen Analyseverfahren ist ein erfindungsgemäßes Verfahren zur Reduktion von Datensätzen beispielsweise auch auf dem Gebiet der Bildverarbeitung denkbar.Detached from spectroscopic Analytical method is a method of reduction according to the invention of records For example, in the field of image processing conceivable.

Ein entsprechendes Computerprogramm, das in Verbindung mit einem Computer direkt oder nach Durchführung einer vorbestimmten Routine ein Verfahren nach einem der Ansprüche 2 bis 13 ausführt, ist ebenfalls durch die vorliegende Erfindung umfasst.One corresponding computer program that in conjunction with a computer directly or after execution a predetermined routine, a method according to any one of claims 2 to 13 executes, is also encompassed by the present invention.

Schließlich umfasst die vorliegende Erfindung ein Computerprogramm, das auf einem computerlesbaren Medium, wie beispielsweise Disketten, Festplatten, tragbare Laufwerke, CDs, DVDs, optische Disketten oder Bänder, gespeichert ist.Finally includes The present invention is a computer program based on a computer readable Media, such as floppy disks, hard drives, portable drives, CDs, DVDs, optical disks or tapes is stored.

Weitere Vorteile und Ausführungsformen der vorliegenden Erfindung ergeben sich aus den Ausführungsbeispielen sowie aus der Zeichnung.Further Advantages and embodiments The present invention will become apparent from the embodiments as well as from the drawing.

Es zeigtIt shows

1 einen schematischen Überblick über wesentliche Verfahrensschritte des erfindungsgemäßen Verfahrens; 1 a schematic overview of essential process steps of the method according to the invention;

2 einen Ausschnitt aus dem Totalionenstrom-Chromatogramm eines Datensatzes; 2 a section of the total ion current chromatogram of a data set;

3 einen Ausschnitt aus dem Summenmassenspektrum (Summe der Scans von 13,85 min bis 14,25 min) des in 2 mit A gekennzeichneten Peaks; 3 a section of the sum mass spectrum (sum of the scans from 13.85 min to 14.25 min) of the in 2 peaks marked A;

4 einen vergrößerten Ausschnitt des Massenspektrums aus 3 in der Umgebung des in 3 mit a bezeichneten Peaks; 4 an enlarged section of the mass spectrum 3 in the environment of in 3 peaks denoted by a;

5 einen Vergleich von Summenmassenspektren, wie sie ausgehend von verschieden verarbeiteten Datensätzen entsprechend dem Summenmassenspektrum der 3 erhalten wurden; und 5 a comparison of sum mass spectra as obtained from differently processed data sets corresponding to the sum mass spectrum of 3 were obtained; and

6 einen Vergleich von Summenmassenspektren, wie sie ausgehend von verschieden verarbeiteten Datensätzen entsprechend dem Summenmassenspektrum der 3 erhalten wurden. 6 a comparison of sum mass spectra as obtained from differently processed data sets corresponding to the sum mass spectrum of 3 were obtained.

Die folgenden Beispiele sollen dazu dienen, die Erfindung zu verdeutlichen. Sie sind jedoch nicht dafür vorgesehen, den Umfang der vorliegenden Erfindung, wie er durch die Patentansprüche bestimmt wird, einzuschränken.The The following examples serve to illustrate the invention. However, they are not intended the scope of the present invention as defined by the claims is going to restrict.

Anhand von 1 wird das erfindungsgemäße Verfahren anhand eines Datensatzes aus einem LC-MS-Experiment schematisch beispielhaft erläutert.Based on 1 the method according to the invention is explained schematically by way of example on the basis of a data set from an LC-MS experiment.

Ein solcher Datensatz besteht hier beispielsweise aus einer Anzahl einzelner Massenspektren, die in regelmäßiger zeitlicher Abfolge aufgenommen werden. Ein solches Einzelmassenspektrum Mα, das aus einer Anzahl an Wertepaaren (xαj, yαj) besteht, ist schematisch im oberen Schaubild in 1A dargestellt.Such a data set consists here, for example, of a number of individual mass spectra, which are recorded in a regular chronological order. Such a single mass spectrum M α , which consists of a number of value pairs (x αj , y αj ), is shown schematically in the upper graph in FIG 1A shown.

Diese Einzelmassenspektren werden nun in einem ersten Schritt intervallartig summiert. Dies geschieht, indem eine bestimmte Anzahl an Spektren, die zeitlich aufeinander folgend aufgenommen wurden, summiert werden. Hierbei umfassen die im Summationsintervall Tα summierten Spektren das Einzelmassenspektrum Mα, das zum Zeitpunkt tα aufgenommen wurde, sowie die Spektren Mα–6, Mα–5, Mα–4, Mα–3, Mα–2, Mα–1, Mα+1, Mα+2, Mα+3, Mα+4, Mα+5 und Mα+6.These individual mass spectra are now summed at intervals in a first step. This is done by summing a certain number of spectra, which were taken in chronological succession. Here, the spectra summed in the summation interval T α include the single mass spectrum M α , which was recorded at the time t α , and the spectra M α-6 , M α-5 , M α-4 , M α-3 , M α-2 , M α-1 , M α + 1 , M α + 2 , M α + 3 , M α + 4 , M α + 5 and M α + 6 .

Das auf diese Weise erhaltene erste Summenmassenspektrum M'α ist im unteren Schaubild in 1A gezeigt.The first sum mass spectrum M ' α obtained in this way is shown in the lower graph in FIG 1A shown.

In einem zweiten Schritt, gezeigt in 1B, werden die so erhaltenen ersten Summenmassenspektrum M'α erneut summiert. Diese Summation erfolgt jedoch anders als im ersten Summationsschritt innerhalb der jeweiligen ersten Summenmassenspektren. Hier werden die zu den x'αk-Werten gehörigen y'αk-Werte innerhalb eines Intervalls X'αk jeweils intervallartig zu einem y''αk-Wert summiert, so dass das im unteren Schaubild in 1B gezeigte zweite Summenmassenspektrum M''α entsteht.In a second step, shown in 1B , the thus obtained first sum mass spectrum M ' α are summed up again. However, this summation occurs differently than in the first summation step within the respective first sum mass spectra. Here, the x 'αk values associated y' values are αk 'αk each intermittently to a y' within an interval X 'αk value summed so that in the lower diagram in 1B shown second sum mass spectrum M '' α arises.

Aus diesen zweiten Summenmassenspektrums M''α wird nun ein erster statistischer Parameter bestimmt, woraus wiederum ein Schwellenwert Yα ermittelt wird.From these second sum mass spectrum M a first statistical parameters will now be determined, from which in turn a threshold value Y is α determined.

Dieser Schwellenwert ist im oberen Schaubild in 1C durch eine horizontale Linie im zweiten Summenmassenspektrum angegeben. Erkennbar liegen einige y''αk-Werte in dem zweiten Summenmassenspektrum unter dem Schwellenwert Yα.This threshold is shown in the upper graph in 1C indicated by a horizontal line in the second sum mass spectrum. As can be seen, some y " αk values in the second sum mass spectrum are below the threshold value Y α .

Diese y''αk-Werte, die kleiner als Yα sind, sind einem x''αk-Wert zugeordnet. Diesem jeweiligen x''αk-Wert im zweiten Summenmassenspektrum M''α entspricht ein xαk-Wert in einem Einzelmassenspektrum Mα. Dieses entsprechende Einzelmassenspektrum Mα ist zur verbesserten Übersichtlichkeit noch einmal direkt unter dem Summenmassenspektrum M''α in dem zweiten Schaubild von oben in der 1C erneut dargestellt.These y " αk values, which are smaller than Y α , are assigned to an x" αk value. This respective x '' αk value in the second sum mass spectrum M '' α corresponds to an x αk value in a single mass spectrum M α . For the sake of clarity, this corresponding individual mass spectrum M α is once again directly below the sum mass spectrum M " α in the second graph from above in FIG 1C shown again.

In einem letzten Schritt werden die Wertepaare (xαj, yαj) aus dem jeweiligen entsprechenden Einzelmassenspektrum Mα entfernt, deren entsprechende y''αk-Werte kleiner als Yα sind.In a last step, the pairs of values (x αj , y αj ) are removed from the corresponding respective single mass spectrum M α , whose corresponding y " αk values are smaller than Y α .

Auf diese Weise entsteht ein reduzierter Datensatz ohne den Verlust relevanter Information.On this way, a reduced data set is created without the loss relevant information.

Das Ergebnis der erfindungsgemäßen Datenverarbeitung wird im Folgenden anhand eines beispielhaften LCMS-Datensatzes näher erläutert.The Result of the data processing according to the invention is explained in more detail below with reference to an exemplary LCMS data set.

Bei der dem Datensatz zu Grunde liegenden Probe handelt es sich um einen Proteinspot, der aus einem Polyacrylamidgel isoliert wurde. Die reduzierte und alkylierte Probe wurde tryptisch verdaut.at the sample underlying the dataset is a Protein spot isolated from a polyacrylamide gel. The reduced and alkylated sample was tryptically digested.

Die im Chromatographieschritt erfolgte RP („reversed phase")-Analyse des Peptidgemisches erfolgte mit Hilfe einer Vydac C18-Kapillarsäule (Durchmesser 0,3 mm, Länge 150 mm) und eines linearen Acetonitril/Wasser-Gradienten (Eluent A: Wasser mit 0,075% (v/v) TFA; Eluent B: 80% Acetonitril/20% Wasser mit 0,055% TFA; Gradient: 5% B bis 90% B in 30 Minuten; Flussrate 5 μl/min).The reversed phase analysis of the peptide mixture was carried out with the aid of a Vydac C 18 capillary column (diameter 0.3 mm, length 150 mm) and a linear acetonitrile / water gradient (eluent A: water with 0.075 % (v / v) TFA; Eluent B: 80% acetonitrile / 20% water with 0.055% TFA; gradient: 5% B to 90% B in 30 minutes, flow rate 5 μl / min).

2 zeigt einen Ausschnitt aus dem so erhaltenen Totalionenstrom-Chromatogramm der zu analysierenden reduzierten, alkylierten und tryptisch verdauten Proteinspotprobe. Klar erkennbar ist, wie der RP-Trennungsschritt die Probe aufgetrennt hat, so dass die einzelnen Bestandteile der zu analysierenden Probe in zeitlicher Abfolge als Eluat die Säule verlassen haben. 2 shows a section of the resulting total ion current chromatogram of the analyzed reduced, alkylated and tryptically digested protein poth sample. It can clearly be seen how the RP separation step separated the sample, so that the individual constituents of the sample to be analyzed had left the column in time sequence as eluate.

Dieses Eluat der Säule wurde direkt in die Quelle eines Electrospray-Massenspektrometers eingeleitet. Bei dem Gerät handelte es sich um ein Q-Tof 2 der Fa. Micromass, GB. Als Ionenquelle wurde eine Nano-Spray-Vorrichtung verwendet. Der zeitliche Abstand zwischen den Massenspektren betrug 2,15 s, die Massenspektren wurden von 200 amu bis 2000 amu aufgenommen. Hierbei entspricht 1 (Atommasseneinheit (atomic mass unit)) 1,660538 × 10–27 kg.This eluate of the column was introduced directly into the source of an electrospray mass spectrometer. The device was a Q-Tof 2 from Micromass, GB. As the ion source, a nano-spray device was used. The time interval between the mass spectra was 2.15 s, the mass spectra were recorded from 200 amu to 2000 amu. Here, 1 (atomic mass unit) corresponds to 1.660538 × 10 -27 kg.

Ein Summenspektrum des so aufgenommenen Datensatzes ist in 3 gezeigt. 3 zeigt einen Ausschnitt aus dem Summenmassenspektrum (Summe der Scans von 13,85 min bis 14,25 min) des in 2 mit A gekennzeichneten Peaks. Der Datensatz weist die in Tabelle 1 angegebenen Eigenschaften auf: Tabelle 1:

Figure 00200001
A sum spectrum of the thus recorded data record is in 3 shown. 3 shows a section of the sum mass spectrum (sum of the scans of 13.85 min to 14.25 min) of the in 2 with A marked peaks. The record has the properties given in Table 1: Table 1:
Figure 00200001

4 zeigt einen vergrößerten Ausschnitt aus dem Spektrum aus 3. Es ist deutlich sichtbar, dass sich die einzelnen Peaks des Massenspektrums über einen gewissen m/z-Bereich erstrecken und einen FWHM-Wert von etwa 0,15 amu aufweisen. 4 shows an enlarged section of the spectrum 3 , It is clearly visible that the individual peaks of the mass spectrum extend over a certain m / z range and have a FWHM value of about 0.15 amu.

Dieser Datensatz wurde mit dem erfindungsgemäßen Verfahren und vergleichsweise mit dem in der WO 2005031791 offenbarten Verfahren verarbeitet.This Record was using the method of the invention and comparatively processed with the method disclosed in WO 2005031791.

Auf die Druckschrift WO 2005031791 wird hiermit vollinhaltlich verwiesen.On the document WO 2005031791 is hereby incorporated by reference.

Entsprechend dem in der Druckschrift WO 2005031791 gelehrten Verfahren wurden zunächst die Daten ausgelesen, die mit einem jeweiligen Spektrum korrespondieren. Anschließend wurde eine statistische Rausch-Analyse mit diesen ausgelesenen Daten durchgeführt, um statistische Parameter zu erhalten, die mit der Rauschverteilung im Zusammenhang stehen. Bei der Berechnung der Erwartungswerte und der Standardabweichungen als diese statistischen Parameter wurden in Übereinstimmung mit der Beschreibung alle Datenpunkte verwendet und somit auch solche, die Intensitätswerte gleich Null aufwiesen. Aus den erhaltenen statistischen Parametern wurde ein Grenzwert bestimmt. Dieser Grenzwert ergab sich aus dem Erwartungswert, multipliziert mit dem Zweifachen der Standardabweichung. Schließlich wurden die relevanten Signale in einem jeweiligen Spektrum durch Vergleich der Datenpunkte in dem Spektrum mit dem Grenzwert identifiziert. Signale mit einer Intensität unterhalb dieses Grenzwerts wurden verworfen.According to the method taught in document WO 2005031791, the data which correspond to a respective spectrum were first read out. Subsequently, statistical noise analysis was performed on these readout data to obtain statistical parameters related to the noise distribution. In the calculation of the expected values and the standard deviations as these statistical parameters, all data points were used in accordance with the description, and thus also those which had intensity values equal to zero. From the obtained statistical parameters, a limit was determined. This limit resulted from the expected value multiplied by twice the standard deviation. Finally, the relevant signals were in a respective spectrum by comparing the data points in the spectrum with the limit identified. Signals with an intensity below this limit were discarded.

Bei der Verarbeitung desselben Datensatzes mit dem erfindungsgemäßen Verfahren wurde die Breite der Zeitbereiche Tα konstant auf 7 Datenpunkte eingestellt, wobei die Zeitbereiche symmetrisch um tα verteilt waren. Die Breite der m/z-Intervalle X'αk entsprach x'αj/5000, wobei diese Intervalle ebenfalls symmetrisch um x'αj verteilt waren.In the processing of the same data set with the method according to the invention, the width of the time regions T α was set constant to 7 data points, the time regions being distributed symmetrically around t α . The width of the m / z intervals X ' αk corresponded to x' αj / 5000, these intervals also being distributed symmetrically around x ' αj .

Schließlich wurde das Verfahren mit dem Faktor zur Bestimmung der Wertepaarteilbereiche β = 400 und mit variablen Werten für den Faktor f im Bereich von 2 bis 2,5 zur Bestimmung des Schwellenwerts durchgeführt.Finally became the method with the factor for the determination of the Wertepaarteilbereiche β = 400 and with variable values for the factor f in the range of 2 to 2.5 for determining the threshold value carried out.

Die Dateigrößen, die sich dadurch ergeben, dass alle Datenpunkte aus den Originalspektren entfernt werden, deren zuzuordnende Intensitäten in den jeweiligen zweiten Summenmassenspektren nach Durchführung der Schritte a) bis f) gemäß Anspruch 2 gleich Null sind, sind in der nachfolgenden Tabelle 2 zusammengestellt und werden mit den resultierenden Dateigrößen nach der Datensatzverarbeitung gemäß der WO 2005031791 verglichen. Tabelle 2:

Figure 00220001
The file sizes that result from removing all data points from the original spectra whose associated intensities in the respective second sum mass spectra are equal to zero after performing steps a) to f) are summarized in Table 2 below compared with the resulting file sizes after the record processing according to WO 2005031791. Table 2:
Figure 00220001

Zur Bewertung der resultierenden Datensätze wurden von den Datensätzen mit f = 2,15 und f = 2,50 die Summenmassenspektren berechnet.to Evaluation of the resulting records were from the records using f = 2.15 and f = 2.50 calculates the sum mass spectra.

Vergleiche der entsprechenden Summenmassenspektren sind in den 5 und 6 gezeigt.Comparisons of the corresponding sum mass spectra are given in FIGS 5 and 6 shown.

In 5 wurde das mit „Original geglättet" bezeichnete Spektrum dadurch erhalten, dass das vom Originaldatensatz abgeleitete Einzelspektrum a) einer binomialen Glättung unterworfen wurde. Dieses geglättete Spektrum ist mit b) bezeichnet. Die in dieses Spektrum eingezeichnete Linie entspricht dem Rauschpegel des Spektrums, d.h. dass Peaks oberhalb der Linie als echt zu betrachten sind, während Peaks, die die Linie nicht übersteigen, nicht notwendigerweise als signifikant anzusehen sind. Das Vergleichsspektrum c) wurde nach der Datenverarbeitung mit dem in der WO 2005031791 offenbarten Verfahren erhalten. Spektrum d) wurde mit dem erfindungsgemäßen Verfahren erstellt. Hierbei wurde für f ein Wert von 2,15 gewählt.In 5 The "original smoothed" spectrum was obtained by subjecting the single spectrum a) derived from the original data set to binomial smoothing This smoothed spectrum is labeled b) The line drawn in this spectrum corresponds to the noise level of the spectrum, ie peaks are considered to be true above the line, while peaks which do not exceed the line are not necessarily to be regarded as significant The comparison spectrum c) was obtained after data processing with the method disclosed in WO 2005031791. Spectrum d) was measured with the invention Created a method for which a value of 2.15 was chosen.

Der mit dem erfindungsgemäßen Verfahren mit f = 2,15 erhaltene Datensatz besitzt entsprechend der oben gezeigten Tabelle einen Umfang, der etwas kleiner ist als der Umfang des gemäß der WO 2005031791 erhaltenen Datensatzes. Trotz ungefähr gleichen Umfangs sind im Massenspektrum, das entsprechend dem erfindungsgemäßen Verfahren erhalten wurde, alle die im Spektrum b) mit Buchstaben gekennzeichneten signifikanten Peaks eindeutig erkennbar.Of the with the method according to the invention with f = 2.15 obtained record has according to the one shown above Table a circumference that is slightly smaller than the scope of the according to the WO 2005031791 received record. Despite about the same extent are in Mass spectrum, according to the method of the invention all those in spectrum b) marked with letters significant peaks clearly identifiable.

Im Gegensatz dazu sind in dem nach WO 2005031791 erzeugten Massenspektrum die Peaks b, e, i, r, t und w nicht mehr erkennbar.in the In contrast, in the mass spectrum produced according to WO 2005031791 the peaks b, e, i, r, t and w are no longer recognizable.

Analog zu 5 wurden das in 6 mit b) bezeichnete Spektrum dadurch erhalten, dass das vom Originaldatensatz abgeleitete Spektrum a) einer binomialen Glättung unterworfen wurde.Analogous to 5 were the in 6 obtained with b) spectrum obtained by the fact that the derived from the original data set spectrum a) was subjected to a binomial smoothing.

Das Vergleichsspektrum c) wurde nach der Datenverarbeitung mit dem in der WO 2005031791 offenbarten Verfahren erhalten und ist mit dem in 5 gezeigtem Spektrum identisch.The comparison spectrum c) was after the data processing with that in WO 2005031791 open barten process and is with the in 5 identical spectrum shown.

Das mit d) bezeichnete Spektrum wurde abgeleitet aus einem Datensatz, der entsprechend dem erfindungsgemäßen Verfahren mit f = 2,50 erhalten wurde.The d) was derived from a data set, the according to the inventive method with f = 2.50 was obtained.

Es ist offensichtlich, dass selbst bei dem mit f = 2,50 entsprechend dem erfindungsgemäßen Verfahren erhaltene Spektrum die Detektierbarkeit signifikanter Peaks mit Intensitäten an der Nachweisgrenze verglichen mit dem gemäß WO 2005031791 erhaltenen Spektrum stark verbessert ist. Dies gilt, obwohl der entsprechende Datensatz einen Umfang besitzt, der lediglich 55 % des Umfangs des nach der WO 2005031791 erhaltenen Datensatzes beträgt.It is obvious that even with the f = 2.50 accordingly obtained by the process according to the invention Spectrum the detectability of significant peaks with intensities at the Detection limit compared with that obtained according to WO 2005031791 Spectrum is greatly improved. This is true, though the corresponding Record has a scope that is only 55% of the scope of the according to WO 2005031791 record obtained.

Da der Rechenaufwand zur automatischen Auswertung von LCMS-Datensätzen ungefähr mit dem Quadrat der Datensatzgröße zunimmt, bedeutet eine Halbierung der Datensatzgröße bei gleichzeitig verbesserter Detektierbarkeit von Signalen nahe der Nachweisgrenze einen wesentlichen Vorteil.There the computational effort to automatically evaluate LCMS datasets approximately square the record size increases, means halving the record size while improving Detectability of signals near the detection limit a substantial Advantage.

So können durch das erfindungsgemäße Verfahren kleinere Datensätze mit sehr genauen Informationen auch mit vergleichsweise leistungsschwachen Computern zügig bearbeitet werden.So can by the method according to the invention smaller records with very accurate information even with comparatively low-performance Computers swiftly to be edited.

Die Genauigkeit an der Nachweisgrenze erlaubt dabei dennoch eine sehr detaillierte Auswertung der Daten.The Nevertheless, accuracy at the detection limit allows a very high degree of accuracy detailed evaluation of the data.

Auch die Datensicherung erfordert geringere Systemressourcen, da durch die Nichtberücksichtigung unspezifischer Information und durch die Beschränkung auf die signifikante Information die zu speichernde Datenmenge erheblich reduziert wird.Also the backup requires less system resources, as by the disregard of non-specific Information and through the restriction on the significant information the amount of data to be stored considerably is reduced.

Claims (15)

Verfahren zur Reduktion eines Datensatzes, der aus N (n+1)-Tupeln (x, x, ... x, yα) besteht, wobei α=1, 2, ..., N gilt und n mindestens 2 beträgt, das die folgenden Schritte aufweist: a) Erstellen eines ersten Summendatensatzes dadurch, dass die y-Werte der Tupel ersetzt werden durch die Summen der y-Werte derjenigen Tupel, deren x1-Werte in einem Intervall um den x1-Wert des ursprünglichen Tupels liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der x1-Dimension entsprechen, b) Erstellen eines zweiten Summendatensatzes dadurch, dass die y-Werte der Tupel des in a) erhaltenen ersten Summendatensatzes ersetzt werden durch die Summen der y-Werte derjenigen Tupel, deren x2-Werte in einem Intervall um den x2-Wert des ursprünglichen Tupels des ersten Summendatensatzes liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der x2-Dimension entsprechen, c) Für alle n > 2, falls vorhanden: Erstellen eines n-ten Summendatensatzes dadurch, dass die y-Werte der Tupel des in b) erhaltenen n-1-ten Summendatensatzes ersetzt werden durch die y-Werte derjenigen Tupel, deren xn-Werte in einem Intervall um den xn-Wert des ursprünglichen Tupels des n-1-ten Summendatensatzes liegen, wobei die Intervalle so gewählt sind, dass ihre Breiten der Breite charakteristischer Signale in der xn-Dimension entsprechen, d) Ermitteln mindestens eines jeweiligen ersten statistischen Parameters des jeweiligen n-ten Summendatensatzes aus Schritt b) oder c), e) Ermitteln eines jeweiligen Schwellenwertes für die y-Werte aus dem jeweiligen ersten statistischen Parameter, f) Vergleichen der y-Werte des n-ten Summendatensatzes mit dem jeweiligen Schwellenwert, g) Erzeugen eines reduzierten Datensatzes durch Entfernen aller Tupel des zu reduzierenden Datensatzes, deren entsprechender y-Wert im n-ten Summendatensatz aus Schritt b) oder c) nicht größer als der Schwellenwert ist.A method of reducing a data set consisting of N (n + 1) tuples (x , x , ... x , y α ), where α = 1, 2, ..., N and n at least 2, comprising the steps of: a) generating a first sum data set by replacing the y values of the tuples with the sums of the y values of those tuples whose x 1 values are in an interval around the x 1 value lie the original tuple, the intervals are chosen so that their widths correspond to the width of characteristic signals in the x 1 dimension, b) creating a second sum data set in that the y values replace the tuples of the first summation data set obtained in a) are determined by the sums of the y-values of those tuples whose x 2 values lie in an interval around the x 2 value of the original tuple of the first sum data set, the intervals being chosen such that their widths are equal to the width of characteristic signals in the x 2 dimension, c) For all n> 2, if available: Creation of an nth sum data set by replacing the y values of the tuples of the n-1th sum data set obtained in b) with the y values of those tuples whose x n Values are at an interval around the x n value of the original tuple of the n-th summation data set, the intervals being chosen such that their widths correspond to the width of characteristic signals in the x n dimension; d) determining at least one e) determining a respective threshold value for the y values from the respective first statistical parameter, f) comparing the y values of the nth sum data record with the respective first statistical parameter of the respective nth summation data record from step b) or c) g) generating a reduced data set by removing all tuples of the data set to be reduced, whose corresponding y-value in the nth total data record from step b) or c) is not greater than that Threshold is. Verfahren zur Reduktion von Chromatographie-Massenspektroskopiedatensätzen durch Entfernen unspezifischer Signale aus Datensätzen, die aus einer Gesamtheit von N Massenspektren Mα bestehen, die zu den aufeinander folgenden Zeiten tα aufgenommen werden und die jeweils nα Wertepaare (xαj, yαj) aufweisen, wobei die xαj die m/z-Werte und die yαj die Intensitätswerte darstellen und α ∊ {1,2, ..., N} sowie j ∊ {1,2, ..., nα} gilt, das die folgenden Schritte aufweist: a) für α ∊ {1, ...N} Summieren von einzelnen Massenspektren aus der Gesamtheit der Massenspektren einschließlich Mα, die innerhalb eines tα einschließenden Zeitintervalls Tα aufgenommen wurden, zu jeweiligen ersten Summenmassenspektren M'α bestehen aus n'α Wertepaaren (x'αk, y'αk), wobei k ∊ {1,2, .., n'α} gilt, und die Breite der Zeitintervalle Tα in Abhängigkeit von der Breite von mindestens einem chromatographischen Peak im Zeitbereich um tα bestimmt wird, b) für jedes x'αk eines jeweiligen ersten Summenmassenspektrums M'α Summieren der Werte y'αm, deren entsprechende Werte x'αm in einem m/z-Intervall X'αk um x'αk liegen, zu jeweiligen Summenwerten y''αk, um ein jeweiliges zweites Summenmassenspektrum M''α zu erhalten mit den Wertepaaren (x''αk=x'αk, y''αk), wobei das m/z-Intervall X'αk in Abhängigkeit von der Breite der entsprechenden massenspektrometrischen Peaks im Bereich um x'αk bestimmt wird, c) Ermitteln mindestens eines jeweiligen ersten statistischen Parameters des jeweiligen zweiten Summenmassenspektrums M''α, d) Ermitteln eines jeweiligen Schwellenwerts Yα aus dem jeweiligen ersten statistischen Parameter, e) Vergleichen der Summenwerte y''αk mit dem jeweiligen Schwellenwert Yα, f) Erzeugen eines jeweiligen reduzierten Datensatzes durch Entfernen der Wertepaare (xαj, yαj) der jeweiligen Massenspektren Mα, für die die entsprechenden Summenwerte y''αk nicht größer als der jeweilige Schwellenwert Yα sind, wobei x''αk = xαj gilt.Method for reducing chromatography-mass spectroscopy datasets by removing nonspecific signals from data records which consist of a total of N mass spectra M α , which are recorded at successive times t α and which each have n α value pairs (x αj , y αj ), where the x αj represent the m / z values and the y αj the intensity values and α ε {1,2, ..., N} and j ε {1,2, ..., n α }, which is the comprising the following steps: a) for α ε {1, ... N} summing individual mass spectra of the total of the mass spectra including M α taken α within a t α enclosing the time interval T, consist of respective first sum mass spectra M from n ' α value pairs (x' αk , y ' αk ), where k ε {1,2, .., n' α }, and the width of the time intervals T α is determined as a function of the width of at least one chromatographic peak in the time domain by t α , b) for each x ' α k of a respective first sum mass spectrum M' α summing the values y ' αm whose corresponding values x' αm in a m / z interval X ' αk by x' αk , to respective sum values y " αk to obtain a respective second sum mass spectrum M" α with the value pairs (x " αk = x ' αk , y '' αk ), wherein the m / z interval X ' αk is determined as a function of the width of the corresponding mass spectrometric peaks in the range around x' αk , c) determining at least one respective first statistical parameter of the respective second sum mass spectrum M '' α , d) determining a respective threshold value Y α from the respective first statistical parameter, e) comparing the sum values y " αk with the respective threshold value Y α , f) generating a respective reduced data set by Removing the value pairs (x αj , y αj ) of the respective mass spectra M α , for which the corresponding sum values y '' αk are not greater than the respective threshold Y α , where x '' αk = x αj . Verfahren gemäß Anspruch 2, wobei im Schritt a) eine gewichtete Summation erfolgt, bei der die Gewichtung der zu summierenden Massenspektren Mβ eine mit dem Betrag |tα – tβ| des zeitlichen Abstands des Massenspektrums vom jeweiligen Massenspektrum Mα monoton abnehmende Funktion darstellt.Method according to claim 2, wherein in step a) a weighted summation takes place in which the weighting of the mass spectra M β to be summed takes place with the magnitude | t α -t β | represents the temporal distance of the mass spectrum of the respective mass spectrum M α monotonically decreasing function. Verfahren gemäß Anspruch 2, wobei im Schritt b) eine gewichtete Summation erfolgt, bei der die Gewichtung der jeweiligen Werte y'αm eine mit dem Betrag |X'αm – X'αk| des Abstandes des jeweiligen Wertes x'αm von x'αk monoton abnehmende Funktion darstellt.Method according to claim 2, wherein in step b) a weighted summation takes place, in which the weighting of the respective values y ' αm one with the magnitude | X' αm -X ' αk | represents the distance of the respective value x ' αm of x' αk monotonically decreasing function. Verfahren gemäß einem der Ansprüche 2 bis 4, wobei die Ermittlung des Schwellenwertes Yα im Schritt d) die folgenden Schritte aufweist: da) Ermittlung eines ersten Schwellenwertes Yα1 aus dem ersten statistischen Parameter, db) Ermitteln mindestens eines zweiten statistischen Parameters für diejenigen Wertepaare des zweiten Summenmassenspektrums M''α, für die der Summenwert y''αk größer als der erste Schwellenwert Yα1 ist, dc) Ermitteln eines zweiten Schwellenwertes Yα2 aus dem zweiten statistischen Parameter, dd) Wiederholen der Schritte da) bis dc) bis der Betrag der Differenz zwischen dem ersten Schwellenwert Yα1 und dem zweiten Schwellenwert Yα2 einen vorbestimmten Grenzwert ΔY nicht mehr übersteigt.Method according to one of claims 2 to 4, wherein the determination of the threshold value Y α in step d) comprises the following steps: da) determination of a first threshold value Y α1 from the first statistical parameter, db) determination of at least one second statistical parameter for those value pairs of the second sum mass spectrum M '' α , for which the sum value y '' αk is greater than the first threshold Y α1 , dc) determining a second threshold Y α2 from the second statistical parameter, dd) repeating the steps da) to dc) to the amount of the difference between the first threshold Y α1 and the second threshold Y α2 does not exceed a predetermined threshold ΔY. Verfahren gemäß einem der Ansprüche 2 bis 5, wobei die Schritte c) bis e) für den gesamten Wertepaarbereich des jeweiligen zweiten Summenmassenspektrums M''α durchgeführt werden.Method according to one of claims 2 to 5, wherein the steps c) to e) for the entire value pair range of the respective second sum mass spectrum M '' α are performed. Verfahren gemäß einem der Ansprüche 2 bis 6, wobei zur Durchführung der Schritte c) bis e) das jeweilige zweite Summenmassenspektrum M''α in Wertepaarteilbereiche Iακ mit
Figure 00280001
unterteilt wird, und die Schritte c) bis e) jeweils für einen Wertepaarteilbereich Iακ durchgeführ werden.
Method according to one of claims 2 to 6, wherein for carrying out steps c) to e) the respective second sum mass spectrum M '' α in Wertepaarteilbereiche I ακ with
Figure 00280001
is divided, and the steps c) to e) in each case for a Wertepaarteilbereich I ακ be performed.
Verfahren gemäß Anspruch 7, wobei der jeweilige Wertepaarteilbereich Iακ in Abhängigkeit von der Breite der massenspektrometrischen Peaks bestimmt wird.The method according to claim 7, wherein the respective value pair portion I ακ is determined as a function of the width of the mass spectrometric peaks. Verfahren gemäß einem der Ansprüche 2 bis 8, wobei der jeweilige Zeitbereich Tα im Wesentlichen der vollen Breite auf halber Höhe, FWHM, der chromatographischen Peaks entspricht.Method according to one of claims 2 to 8, wherein the respective time range T α substantially corresponds to the full width at half height, FWHM, of the chromatographic peaks. Verfahren gemäß einem der Ansprüche 2 bis 9 wobei das m/z-Intervall X'ακ im Wesentlichen der vollen Breite auf halber Höhe, FWHM, der massenspektrometrischen Peaks entspricht.A method according to any one of claims 2 to 9 wherein the m / z interval X ' ακ is substantially equal to the full width at half height, FWHM, of the mass spectrometric peaks. Verfahren gemäß einem der Ansprüche 7 bis 10, wobei die Wertepaarteilbereiche Iακ entsprechend der folgenden Gleichungen bestimmt werden:
Figure 00280002
Figure 00290001
wobei x(u)ακ die untere Grenze und x(o)ακ die obere Grenze des Wertepaarteilbereichs Iακ sind, β einen Faktor darstellt, der größer als 5 ist und δ für die Breite des m/z-Intervalls X'ακ im Wertepaarbereich Iακ steht.
Method according to one of claims 7 to 10, wherein the value pair subareas I ακ are determined according to the following equations:
Figure 00280002
Figure 00290001
in which x (U) ακ the lower limit and x (O) ακ the upper limit of the value pair portion I ακ , β represents a factor which is greater than 5 and δ stands for the width of the m / z interval X ' ακ in the value pair range I ακ .
Verfahren gemäß einem der Ansprüche 1 bis 11, wobei im Schritt c) der Mittelwert MWα und die Standardabweichung SDα der von Null verschiedenen Intensitätswerte als statistische Parameter bestimmt werden und im Schritt d) der Schwellenwert Yα entsprechend der Gleichung Yα = MWα + f(α)·SDα bestimmt wird, wobei f(α) einen Faktor darstellt.Method according to one of claims 1 to 11, wherein in step c) the mean value MW α and the standard deviation SD α of the non-zero intensity values are determined as statistical parameters and in step d) the threshold value Y α is determined according to the equation Y α = MW α + f (α) · SD α is determined, where f (α) is a factor. Verfahren gemäß Anspruch 12, wobei f(α) einen von α unabhängigen Wert von 0,5 bis 5, insbesondere 2 aufweist.Method according to claim 12, where f (α) a value independent of α from 0.5 to 5, in particular 2. Computerprogramm mit Programmcode, zur Durchführung der Verfahrensschritte nach einem der Ansprüche 1 bis 13, wenn das Programm in einem Computer ausgeführt wird.Computer program with program code, for carrying out the Method steps according to one of claims 1 to 13, when the program running in a computer becomes. Computerprogramm mit Programmcode, der auf einem computerlesbaren Medium gespeichert ist, zur Durchführung des Verfahrens nach einem der Ansprüche 1 bis 13, wenn das Programm in einem Computer ausgeführt wird.Computer program with program code on one computer readable medium is stored to carry out the Method according to one of the claims 1 to 13 when running the program in a computer.
DE200510061819 2005-12-23 2005-12-23 Method for reducing a data record Expired - Fee Related DE102005061819B3 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE200510061819 DE102005061819B3 (en) 2005-12-23 2005-12-23 Method for reducing a data record
PCT/EP2006/011252 WO2007079819A1 (en) 2005-12-23 2006-11-23 Method for the reduction of a data record

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE200510061819 DE102005061819B3 (en) 2005-12-23 2005-12-23 Method for reducing a data record

Publications (1)

Publication Number Publication Date
DE102005061819B3 true DE102005061819B3 (en) 2007-08-23

Family

ID=37969601

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200510061819 Expired - Fee Related DE102005061819B3 (en) 2005-12-23 2005-12-23 Method for reducing a data record

Country Status (2)

Country Link
DE (1) DE102005061819B3 (en)
WO (1) WO2007079819A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3800236A (en) * 1972-02-08 1974-03-26 Bodenseewerk Perkin Elmer Co Circuit arrangement for base line compensation
US5995989A (en) * 1998-04-24 1999-11-30 Eg&G Instruments, Inc. Method and apparatus for compression and filtering of data associated with spectrometry
US20010027382A1 (en) * 1999-04-07 2001-10-04 Jarman Kristin H. Identification of features in indexed data and equipment therefore
WO2005031791A2 (en) * 2003-09-25 2005-04-07 Thermo Finnigan Llc Method of processing and storing mass spectrometry data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3800236A (en) * 1972-02-08 1974-03-26 Bodenseewerk Perkin Elmer Co Circuit arrangement for base line compensation
US5995989A (en) * 1998-04-24 1999-11-30 Eg&G Instruments, Inc. Method and apparatus for compression and filtering of data associated with spectrometry
US20010027382A1 (en) * 1999-04-07 2001-10-04 Jarman Kristin H. Identification of features in indexed data and equipment therefore
WO2005031791A2 (en) * 2003-09-25 2005-04-07 Thermo Finnigan Llc Method of processing and storing mass spectrometry data

Also Published As

Publication number Publication date
WO2007079819A1 (en) 2007-07-19

Similar Documents

Publication Publication Date Title
DE102017111067B4 (en) Isomer analysis in TIMS-Q-q-TOF mass spectrometers
DE60114245T2 (en) METHOD AND DEVICE FOR IDENTIFYING AND QUANTIFYING CHEMICAL COMPONENTS OF A MIXTURE
DE10152821B4 (en) Mass spectra without electronic noise
DE102018000832B4 (en) High resolution MS1-based quantification
DE102010019590B4 (en) Data-dependent acquisition system for mass spectrometry and method for its application
DE69927983T2 (en) METHOD FOR SEPARATING AND ENRICHING ISOTOPES IN THE GAS PHASE
DE102005025499B4 (en) Mass spectrometric mixture analysis
DE10392707B4 (en) Method of using data binning in the analysis of chromatography / spectrometry data
DE112004001811B4 (en) Method for processing and storing mass spectrometry data
DE102004015018A1 (en) Methods and apparatus for identifying related ions from chromatography-mass spectral data sets containing overlapping components
DE602004002856T2 (en) DYNAMIC SIGNAL SELECTION IN A CHROMATOGRAPHY / MASS SPECTROMETER / MASS SPECTROMETRY SYSTEM
DE102016200165A1 (en) mass correction
DE20122885U1 (en) mass spectrometry
WO2011157781A1 (en) Method for ion mobility spectrometry
DE112014003221T5 (en) Method for recording ADC saturation
DE102015201624A1 (en) FAST METHOD OF MEASURING AN IMPACT CROSS SECTION OF IONS USING ION MOBILITY SPECTROMETRY
DE102013006428A1 (en) Time-of-flight mass spectrometer and data compression method therefor
DE112015001668B4 (en) Method for optimizing spectral data
DE112015000644B4 (en) Methods of mass spectrometry and mass spectrometer
DE102014118481A1 (en) Method and apparatus for analyzing a complex sample
DE112019000840T5 (en) Chromatography-Mass Spectrometry Methods and Chromatograph-Mass Spectrometers
DE112017007538T5 (en) Chromatography mass spectrometry and Chromatograph mass spectrometer
DE102020129645A1 (en) Mass spectrometry method
DE102020112460A1 (en) Dynamic control of the accumulation time for chromatography-mass spectrometry
DE102008046139B4 (en) Method for the quantitative determination of a substance by mass spectrometry

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee