Forschung: Bitcoin-Benutzeridentifikation über neuronale Netze

Datenschutz und relative Anonymität sind die vorteilhaftesten Währungsmerkmale von Bitcoin. Im Gegensatz zur Übermittlung vieler persönlicher Daten zur Eröffnung eines Bankkontos genügt ein Pseudonym, das auch als Hash Public Key oder Adresse bezeichnet wird, um Bitcoin nutzen zu können. Sofern nicht absichtlich offenbart, ist es relativ schwierig, die Identität eines bestimmten Bitcoin-Pseudonyms über Blockchain-Daten zu identifizieren.

https://drogenkaufen.com/index.php/wichtig-bitcoin-anonymitaet/

Bitcoin ist jedoch nicht völlig anonym. Die Blockchain-Transaktionsanalyse ist eine der am häufigsten verwendeten Methoden, um Bitcoin-Nutzer zu deanonymisieren. Da Transaktionsdaten auf der Blockchain von Bitcoin öffentlich zugänglich sind, kann durch die Analyse von Transaktionen ein Bitcoin-Flussdiagramm erstellt werden. Adress-Clustering in Kombination mit Adressbenutzer-Mapping machen Adressverfolgung und quantitative Analyse möglich. Dennoch sind die Ergebnisse des Adress-Clusters aufgrund der Ungenauigkeit verschiedener Heuristiken, die während des gesamten Prozesses verwendet werden, sehr unbefriedigend.

Ein kürzlich veröffentlichtes Papier stellte einen neuartigen Ansatz vor, der auf Deep Learning basiert, um eine erfolgreiche Adressbenutzerzuordnung durchzuführen. Der Ansatz definiert Bitcoin-Adressen über ihr Transaktionsverhalten und sucht nach verborgenen Merkmalen und Mustern von Nutzern, die helfen können, den Besitzer einer bestimmten Adresse von Millionen anderer Bitcoin-Nutzer zu unterscheiden.

Der vorgeschlagene Ansatz erreicht eine Zuordnung von Bitcoin-Adressdarstellungen zu einem euklidischen Raum, in dem Entfernungen ein Maß für die Adressähnlichkeit darstellen. Die Entwickler des vorgeschlagenen Systems trainierten ein tiefes neuronales Netzwerk zum Zwecke der Verhaltenseinbettung und -optimierung, um jeder Bitcoin-Adresse einen Adressfunktionsvektor zuordnen zu können. Adressbesitzer werden durch Adresserkennung, -verifizierung und -clusterung identifiziert, wobei die Implementierung direkt auf dem Abstand zwischen den Vektoren der Adressfunktionen basiert. Ein Datensatz für die Adressbenutzerpaarung wird mit umfangreichen Sammlungen und akribischer Hygiene angelegt. Der vorgeschlagene Ansatz wurde mit dem Datensatz getestet und seine Effizienz bestätigt. Im Gegensatz zu heuristisch basierten Ansätzen zeigte der vorgeschlagene Ansatz eine hohe Effizienz bei der Identifizierung von Bitcoin-Nutzern.

Das tiefliegende Bitcoin-Benutzeridentifikationsmodell:

Deep Learning ermöglicht es Computersystemen, die Datenrepräsentation mit fortgeschrittenen Abstraktionsebenen zu erlernen und Informationen zu identifizieren, die in riesigen Datensätzen verborgen sind. Im vorgeschlagenen Bitcoin-Benutzeridentifikationsmodell wird eine Adresse durch die damit verbundenen Transaktionen definiert, was das Verhältnis zwischen einer Bitcoin-Adresse und der Identität ihres Eigentümers offenbart. Im Gegensatz zum traditionellen überwachten Lernen, aber ähnlich wie bei der Gesichtserkennung, besteht das Ziel des vorgeschlagenen Modells darin, für jede Adresse ein einzigartiges Merkmal zu identifizieren, das als Einbettung des Benutzerverhaltens im gesamten Bitcoin-Netzwerk betrachtet werden kann.

Sobald die Einbettungen erreicht sind, werden die drei progressiven Ziele der Bitcoin-Adressenerkennung, -Verifizierung und -Clustering zu einem einfachen Prozess der Entfernungsberechnung. Im Gesichtserkennungsmodell hilft eine sorgfältig entwickelte Verlustfunktion, z.B. Center Loss, AM-Softmax, Range Loss, etc., dem Netzwerk, jedes erkannte Gesichtsbild in einen linear trennbaren Merkmalsraum einzubetten und verstärkt seine diskriminierende Wirkung. Die Ähnlichkeit zwischen Gesichtserkennung und Bitcoin-Benutzeridentifikation inspirierte die Entwickler des vorgeschlagenen Modells, dem gleichen Muster zu folgen.

Das vorgeschlagene Modell beinhaltet die Strukturierung einer Pipeline, die für die Darstellung des Bitcoin-Adressverhaltens verwendet werden kann. Es wandelt Rohblockkettendaten in primäre Adressvektoren um, die vom erstellten Netzwerk verarbeitet werden können. Danach wird die optimale Verlustfunktion identifiziert und zur Steuerung des Trainingsprozesses verwendet. Um optimale Ergebnisse über ein Deep-Learning-Modell zu erzielen, bedarf es zudem umfangreicher Datenproben und perfekt gestalteter Trainingsstrategien – beides ist entlang des Prozesses der Bitcoin-Benutzeridentifikation relativ schwer zu erwerben. Die Menge an solider Wahrheit ist begrenzt, da die Nutzer in der Regel nur ungern ihre Adressen preisgeben. Im Gegensatz zur Verwendung von weit verbreiteten und gut untersuchten Datensätzen zum Testen und Trainieren anderer traditioneller Deep-Learning-Herausforderungen haben die Entwickler des Bitcoin-Benutzeridentifikationsmodells einen einzigartigen Adressbenutzerdatensatz unter Verwendung aller möglichen Datenquellen entwickelt.

Wert des vorgeschlagenen Modells in der Bitcoin-Benutzeridentifikation:

Das vorgeschlagene Modell stellt eine Bitcoin-Adresse durch seinen vollständigen Satz von Attributen dar. Der Vektor der Adressfunktion identifiziert nicht nur die Beziehung der Adresse zu Transaktionen, sondern auch Verhaltensmuster wie Saldo, Timing und Netzwerkdaten. Auf der anderen Seite ignorieren die Heuristiken eine Menge Informationen. Oftmals ist es erforderlich, eine Vielzahl von Heuristiken zu kombinieren und konservativ zu implementieren, um Fehlverknüpfungen zu vermeiden.

Das vorgeschlagene Modell erlernt auch Adressfunktionen mit weniger, aber umfassenderen Transaktionsinformationen. Das Training des Modells erfordert nur mehrere tausend Proben. Allerdings müssen die Heuristiken alle Transaktionen innerhalb eines bestimmten Zeitraums durchlaufen, der in der Regel Millionen von Transaktionen umfasst.

Letzte Gedanken:

Deep Learning ist effizienter als die Heuristiken bei der Identifizierung von Bitcoin-Nutzern. Weitere Informationen können durch Deep Learning durch Erweiterung des Adressbenutzer-Datensatzes gewonnen werden. Weitere Studien sind erforderlich, um die Mechanismen aufzudecken, die dem Modell des tiefen Lernens in der Bitcoin-Adressanalyse standhalten.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

1 + 2 =