Συνδεθείτε σε 100 πηγές δεδομένων με λίγα μόνο κλικ

1
Συνδεθείτε σε 100 πηγές δεδομένων με λίγα μόνο κλικ

Μια σύγχρονη επιχείρηση βασίζεται σε μια ποικιλία αποθετηρίων για δεδομένα. Αυτές περιλαμβάνουν βάσεις δεδομένων όπως το Postgres, καταστήματα αντικειμένων όπως το AWS S3, καταστήματα συμβάντων όπως το Apache Kafka, λύσεις αποθήκευσης αρχείων όπως το Google Drive και εφαρμογές όπως το Salesforce και το HubSpot.

Όλες αυτές οι βάσεις δεδομένων και οι εφαρμογές εξυπηρετούν συγκεκριμένες επιχειρηματικές ανάγκες. Για παράδειγμα, μια διαδικτυακή επιχείρηση λιανικής μπορεί να χρησιμοποιήσει το Apache Kafka για να καταγράψει την αλληλεπίδραση πελατών με τον ιστότοπό της, το Cassandra για μακροπρόθεσμη αποθήκευση δεδομένων, το Hubspot για τη διαχείριση επιχειρηματικών σχέσεων και το dropbox για τη διαχείριση εσωτερικών αρχείων.

Οι αναλυτικές βάσεις δεδομένων όπως η Kinetica πρέπει να μπορούν να έχουν πρόσβαση και να αναλύουν δεδομένα από όλες αυτές τις διαφορετικές πηγές με εύκολο και αποτελεσματικό τρόπο.

Αλλά αυτό είναι πιο εύκολο να ειπωθεί παρά να γίνει. Κάθε ένα από αυτά τα αποθετήρια έχει τη δική του συχνά μοναδική αντίληψη για τον τρόπο αντιπροσώπευσης, αποθήκευσης και παροχής πρόσβασης σε δεδομένα. Αυτό το ιστολόγιο εξηγεί πώς η Kinetica χρησιμοποιεί το JDBC (Java DataBase Connectivity) και προγράμματα οδήγησης που παρέχονται από την πλατφόρμα συνδεσιμότητας δεδομένων CData για να αντιμετωπίσει αυτήν την πρόκληση.

Υπάρχει επίσης ένα δείγμα βιβλίου εργασίας στο τέλος αυτού του ιστολογίου που χρησιμοποιεί το JDBC για τη σύνδεση και τη φόρτωση δεδομένων από ένα υπολογιστικό φύλλο google και μια βάση δεδομένων Postgres. Μπορείτε να το δοκιμάσετε δωρεάν με Κινητική σύννεφο

Έμφαση στην ευκολία χρήσης

Το Kinetica είναι γνωστό για την ταχύτητά του. Ο διανυσματικός κινητήρας υψηλής απόδοσης και η προσαρμοσμένη βιβλιοθήκη λειτουργιών γεωχωρικών, γραφικών, OLAP και χρονοσειρών σάς επιτρέπουν να κάνετε σύνθετες αναλυτικές εργασίες σε εξαιρετικά μεγάλα δεδομένα.

Τον τελευταίο χρόνο, προσθέσαμε πολλές λειτουργίες ευκολίας χρήσης που συνδυάζουν τώρα την κορυφαία απόδοσή μας στον κλάδο με μια εμπειρία χρήστη χωρίς τριβές. Αυτά περιλαμβάνουν ένα πλούσιο και διαδραστικό περιβάλλον φορητών υπολογιστών SQL που ονομάζεται Workbench, μια ενσύρματη γραμμή Postgres που επιτρέπει στους χρήστες να υποδεικνύουν απλώς υπάρχουσες εφαρμογές που χρησιμοποιούν σύνταξη Postgres στο Kinetica χωρίς να χρειάζεται να αναπαράγουν κώδικα και πηγές δεδομένων JDBC που σας επιτρέπουν να συνδεθείτε σε εκατοντάδες διαφορετικές πηγές δεδομένων με ευκολία.

Το τελευταίο χαρακτηριστικό που συζητήθηκε παραπάνω – οι πηγές δεδομένων JDBC – είναι το κλειδί για την ικανότητα της Kinetica να συνδέεται σε μια ποικιλία αποθετηρίων δεδομένων. Ας ρίξουμε μια πιο προσεκτική ματιά.

Δύο διαδρομές – Προσαρμοσμένες συνδέσεις ή JDBC

Σε γενικές γραμμές, υπάρχουν δύο τρόποι για να δημιουργήσετε μια σύνδεση με μια πηγή δεδομένων – θα μπορούσατε είτε να δημιουργήσετε μια προσαρμοσμένη σύνδεση από την αρχή είτε να βασιστείτε σε ένα υπάρχον πρωτόκολλο.

Οι προσαρμοσμένες υποδοχές προσφέρουν τη μεγαλύτερη ευελιξία και έλεγχο της απόδοσης, καθώς μπορείτε να τις τροποποιήσετε και να τις συντονίσετε ώστε να ταιριάζει καλύτερα στις ανάγκες σας. Ωστόσο, οι προσαρμοσμένες συνδέσεις είναι δύσκολο και χρονοβόρο να κατασκευαστούν και να διατηρηθούν.

Τα γενικευμένα πρωτόκολλα όπως το JDBC, από την άλλη πλευρά, παρέχουν μια out of the box εμπειρία όταν πρόκειται για σύνδεση σε μια πηγή δεδομένων. Ωστόσο, προσφέρουν μικρότερο βαθμό ευελιξίας και ελέγχου, καθώς πρέπει να βασιστείτε στη γενικευμένη διεπαφή που παρέχεται από το πρόγραμμα οδήγησης JDBC και όχι σε αυτήν που έχετε ρυθμίσει ώστε να λειτουργεί καλύτερα με τη λύση σας.

Στην Kinetica, επιλέξαμε μια υβριδική προσέγγιση.

Παρέχουμε προσαρμοσμένες διεπαφές για όλες τις πηγές δεδομένων με τις οποίες είμαστε στενά συνδεδεμένοι. Αυτά περιλαμβάνουν καταστήματα μαζικών δεδομένων όπως HDFS, AWS S3, Azure blob store και Google Cloud Platform και η πιο δημοφιλής λύση για ροή δεδομένων, το Apache Kafka. Για οτιδήποτε άλλο παρέχουμε μια διεπαφή μέσω JDBC.

Τι είναι το JDBC;

Το JDBC σημαίνει Συνδεσιμότητα Βάσης Δεδομένων Java. Είναι ένα τυποποιημένο API για αλληλεπίδραση με βάσεις δεδομένων χρησιμοποιώντας προγράμματα Java. Με το JDBC, οι προγραμματιστές δεν χρειάζεται να ανησυχούν για τη δημιουργία προσαρμοσμένων συνδέσεων για αλληλεπίδραση με μια νέα βάση δεδομένων. Αντίθετα, μπορείτε να χρησιμοποιήσετε το JDBC ως μεσαίο επίπεδο που παρέχει μια τυποποιημένη διεπαφή για σύνδεση, έκδοση ερωτημάτων και χειρισμό αποτελεσμάτων από μια βάση δεδομένων.

Η μόνη απαίτηση είναι η εφαρμογή ή η βάση δεδομένων στην οποία συνδέεστε να διαθέτει πρόγραμμα οδήγησης JDBC. Και εδώ μπαίνει στο παιχνίδι η συνεργασία της Kinetica με την CData.

Αποκτήστε πρόσβαση σε 100 πηγές δεδομένων χρησιμοποιώντας CData

CData είναι μια πλατφόρμα συνδεσιμότητας δεδομένων που παρέχει προγράμματα οδήγησης JDBC για εκατοντάδες βάσεις δεδομένων και εφαρμογές.

Αυτές περιλαμβάνουν βάσεις δεδομένων NoSQL όπως MongoDB, Redis και Cassandra, σχεσιακές βάσεις δεδομένων όπως Postgres, MySQL και Oracle, καταστήματα αρχείων όπως το Dropbox και το Google Drive και επιχειρηματικά εργαλεία όπως το Salesforce, το Google Analytics και το NetSuite.

Το CData κάνει όλη τη δουλειά για τη δημιουργία και τη διατήρηση όλων των προγραμμάτων οδήγησης JDBC που παρέχουν πρόσβαση σε δεδομένα από όλες αυτές τις πηγές δεδομένων. Και ως χρήστης του Kinetica, έχετε δωρεάν πρόσβαση σε όλα αυτά τα προγράμματα οδήγησης.

Τώρα, ας δούμε πώς μπορείτε να χρησιμοποιήσετε ένα πρόγραμμα οδήγησης JDBC για να συνδεθείτε σε μια πηγή δεδομένων.

Συνδεθείτε με δύο μόνο ερωτήματα

Τώρα, υπάρχουν δύο τρόποι με τους οποίους μπορείτε να χρησιμοποιήσετε ένα πρόγραμμα οδήγησης JDBC για να συνδεθείτε σε μια πηγή δεδομένων. Μπορείτε να φορτώσετε το δικό σας πρόγραμμα οδήγησης στο Kinetica ή μπορείτε να αναφέρετε ένα πρόγραμμα οδήγησης CData. Το παράδειγμα βιβλίου εργασίας που είναι κοινόχρηστο στο τέλος αυτού του ιστολογίου χρησιμοποιεί και τις δύο διαδρομές. Χρησιμοποιούμε το πρόγραμμα οδήγησης CData για πρόσβαση σε δεδομένα από ένα υπολογιστικό φύλλο google και, στη συνέχεια, φορτώνουμε ένα δημοσίως διαθέσιμο πρόγραμμα οδήγησης στο Kinetica για να συνδεθούμε σε μια βάση δεδομένων Postgres.

Ανεξάρτητα από τη διαδρομή, τα βήματα για τη φόρτωση δεδομένων είναι εύκολα και διαισθητικά. Ο παρακάτω κώδικας δείχνει πώς να συνδεθείτε σε μια βάση δεδομένων postgres χρησιμοποιώντας ένα πρόγραμμα οδήγησης JDBC για το postgres.

Πρώτα δημιουργείτε την πηγή δεδομένων. Αυτό απαιτεί τη θέση της βάσης δεδομένων μαζί με τα διαπιστευτήρια για την πρόσβαση σε αυτήν. Στις επιλογές, καθορίζουμε τη θέση του προγράμματος οδήγησης JDBC και την κατηγορία προγράμματος οδήγησης.


CREATE OR REPLACE DATA SOURCE postgres_ds
LOCATION = ‘jdbc:postgresql://mydb.com:5432/db'
USER = ‘myusername’
PASSWORD = ‘mypassword’
WITH OPTIONS (
  JDBC_DRIVER_JAR_PATH = 'kifs://drivers/postgresql-42.3.6.jar',
  JDBC_DRIVER_CLASS_NAME = ‘org.postgresql.Driver’
);

Στη συνέχεια, καθορίζετε τον πίνακα στο Kinetica και το όνομα του αρχείου ή του ερωτήματος που επιλέγει τα δεδομένα που θέλετε να φορτώσετε σε αυτό από την πηγή δεδομένων που δημιουργήθηκε στο προηγούμενο βήμα.


LOAD DATA INTO my_kinetica_table
FROM REMOTE QUERY ‘SELECT * FROM public.large_table’
WITH OPTIONS (
   DATA SOURCE = 'postgres_ds'
);

Αυτό ήταν – μόνο δύο απλά ερωτήματα SQL. Μπορούμε να χρησιμοποιήσουμε το ίδιο μοτίβο όπως φαίνεται παραπάνω για να συνδεθούμε σε εκατοντάδες διαφορετικά αποθετήρια δεδομένων χρησιμοποιώντας είτε προσαρμοσμένες συνδέσεις είτε JDBC. Το μόνο που χρειάζεστε είναι τα στοιχεία σύνδεσης και τα σχετικά διαπιστευτήρια.

Χρησιμοποιώντας τη διεπαφή

Ο πάγκος εργασίας της Kinetica διαθέτει επίσης μια διεπαφή σημείου και κλικ για σύνδεση σε εγγενείς πηγές δεδομένων και πηγές δεδομένων JDBC. Αυτός είναι ένας εύκολος τρόπος χωρίς κώδικα για να δημιουργήσετε μια πηγή δεδομένων και να ξεκινήσετε τη φόρτωση δεδομένων από αυτήν στο Kinetica.

Δοκιμάστε το μόνοι σας

Το ακόλουθο ρεπο περιέχει ένα βιβλίο εργασίας που μπορείτε να φορτώσετε στο Kinetica για να το δοκιμάσετε μόνοι σας. Μπορείτε να τρέξετε Κινέτικα στο σύννεφο δωρεάν.

Πόροι

Μπορείτε να βρείτε περισσότερες πληροφορίες σχετικά με τη φόρτωση δεδομένων στο Kinetica από το δικό μας ιστοσελίδα τεκμηρίωσης.

Επικοινωνήστε μαζί μας

Είμαστε μια παγκόσμια ομάδα και μπορείτε να επικοινωνήσετε μαζί μας Χαλαρότητα με τις ερωτήσεις σας και θα επικοινωνήσουμε άμεσα μαζί σας.

Schreibe einen Kommentar