O bază de date face posibilă stocarea și recuperarea datelor sau informațiilor structurate, semi-structurate sau brute , adesea legate de o temă sau o activitate; acestea pot fi de naturi diferite și mai mult sau mai puțin interconectate.
Datele lor pot fi stocate într-o formă foarte structurată ( de exemplu, baza de date relațională ) sau sub formă de date brute nestructurate (cu baze de date NoSQL de exemplu). O bază de date poate fi localizată în același loc și pe același mediu computerizat , sau răspândită pe mai multe mașini în mai multe locuri.
Baza de date se află în centrul sistemelor informatice pentru colectarea, formatarea, stocarea și utilizarea informațiilor . Dispozitivul cuprinde un sistem de gestionare a bazelor de date (abrevierea: SGBD ): un software de motor care manipulează baza de date și direcționează accesul la conținutul acesteia. Astfel de dispozitive includ, de asemenea, software pentru aplicații și un set de reguli legate de accesul și utilizarea informațiilor.
Una dintre cele mai frecvente utilizări ale computerelor este manipularea datelor . Bazele de date sunt utilizate, de exemplu, în sectoarele finanțelor , asigurărilor , școlii , epidemiologiei , administrației publice (inclusiv statistici) și mass-media .
Când mai multe obiecte numite „baze de date” sunt puse împreună sub forma unei colecții, aceasta se numește bază de date .
O bază de date este un „container” care stochează date precum numere, date sau cuvinte, care pot fi reprocesate prin mijloace computerizate pentru a produce informații; de exemplu, numere și nume asamblate și sortate pentru a forma un director . Retratările sunt de obicei o combinație de operații de căutare , alegere, sortare, grupare și concatenare .
Este partea centrală a unui sistem de informații sau a unui sistem de baze de date (sau baza de date pur și simplu), care guvernează colectarea, stocarea, reprocesarea și utilizarea datelor. Acest dispozitiv include adesea software pentru motoare (a se vedea paragraful următor), software pentru aplicații și un set de reguli referitoare la accesul și utilizarea informațiilor.
Sistemul de gestionare a bazelor de date este o suită de programe care manipulează structura bazei de date și direcționează accesul la datele stocate în ea. O bază de date este alcătuită dintr-o colecție de fișiere; este accesat prin SGBD care primește cereri de manipulare a conținutului și efectuează operațiunile necesare asupra fișierelor. Ascunde complexitatea operațiunilor și oferă o imagine sintetică a conținutului. SGBD permite mai multor utilizatori să manipuleze simultan conținutul și poate oferi vizualizări diferite asupra aceluiași set de date.
Utilizarea bazelor de date este o alternativă la metoda tradițională de stocare a datelor, prin care o aplicație plasează date în fișiere manipulate de aplicație. Facilitează schimbul de informații, permite controlul automat al consistenței și redundanței informațiilor, limitarea accesului la informații și producerea mai ușoară a informațiilor rezumative din informații brute. Baza de date are, de asemenea, un efect de unire: într-o comunitate care utilizează o bază de date, o singură persoană - administratorul bazei de date - organizează conținutul bazei de date într-un mod benefic pentru întreaga comunitate., Ceea ce poate evita conflictele datorate intereselor concurente dintre membrii comunității.
O bază de date necesită în general mai mult spațiu pe disc, gama largă de funcții oferite de SGBD face gestionarea mai complexă, iar eșecurile au un impact mai larg și sunt mai greu de recuperat.
Utilizarea datelor este diferită de la o bază de date la alta. Bazele de date pot fi clasificate în funcție de numărul de utilizatori, tipul de conținut, în special dacă este slab sau puternic structurat, precum și în funcție de utilizarea care se face din baza de date, în special utilizarea operațională . Sau pentru analize scopuri :
Bazele de date pot fi clasificate în funcție de numărul de utilizatori - un singur, un grup mic sau chiar o companie. O bază de date Office este instalată pe un computer personal pentru serviciul unui singur utilizator. În timp ce o bază de date corporativă este instalată pe un computer puternic care deservește sute de utilizatori. O bază de date centralizată este instalată într-o singură locație, în timp ce o „ bază de date distribuită ” este răspândită în mai multe locații.
Cel mai popular mod de clasificare a bazelor de date este în funcție de utilizarea acestora și de aspectul temporal al conținutului:
baze operaționale sau OLTP ( procesare tranzacții online ) sunt destinate să ajute utilizatorii să țină evidența activităților zilnice. În special, acestea permit stocarea imediată a informațiilor referitoare la fiecare operațiune desfășurată în cadrul activității: achiziții, vânzări, rezervări, plăți. În astfel de aplicații accentul este pus pe viteza de răspuns și pe capacitatea de a procesa simultan mai multe tranzacții. baze de analiză cunoscute și sub numele de OLAP (din engleză online analytical processing ) sunt compuse din informații istorice, cum ar fi măsurători pe care se efectuează operațiuni masive pentru a obține statistici și prognoze . Bazele de date sunt adesea baze de date de depozite de date (engleză datawarehouse ) utilizate pentru a colecta zilnic cantități uriașe de date istorice pentru o bază de date operațională. Conținutul bazei de date este utilizat pentru a efectua analize ale evoluției temporale și statistici precum cele utilizate în management . În astfel de aplicații, accentul este pus pe capacitatea de a efectua procesări foarte complexe, iar software-ul motorului (SGBD) este în esență un motor de analiză .Bazele de date sunt, de asemenea, uneori clasificate în funcție de caracteristicile conținutului:
Cele hard disk - uri , de stocare în masă de mare capacitate, au fost inventate în 1956 . Invenția hard disk-ului a făcut posibilă utilizarea computerelor pentru a colecta, clasifica și stoca cantități mari de informații într-un mod mai flexibil și mai eficient decât mediul anterior: banda magnetică .
Termenul de bază de date a apărut pentru prima dată în 1964 pentru a se referi la o colecție de informații partajate de diferiți utilizatori ai unui sistem de informații militare.
Primele baze de date ierarhizate au apărut la începutul anilor 1960 . Informațiile au fost împărțite în două niveluri ierarhice: un nivel conținea informații care sunt identice în mai multe înregistrări din baza de date. Decuparea a fost apoi extinsă pentru a lua forma unei diagrame arborescente.
În 1965, Charles Bachman a proiectat arhitectura Ansi / Sparc încă în uz astăzi. În 1969 , a creat modelul de date de rețea în cadrul consorțiului CODASYL pentru aplicații informatice pentru care modelul ierarhic nu este potrivit. Charles Bachman a primit premiul Turing în 1973 pentru „contribuțiile sale remarcabile la tehnologia bazelor de date”.
În 1968 , Dick Pick a creat Pick , un sistem de operare care conține un sistem de gestionare a bazelor de date „cu mai multe valori” (MV RDBMS).
În 1970 , Edgar F. Codd a remarcat în teza sa matematică despre algebra relațională că un set de entități este comparabil cu o familie care definește o relație în matematică și că se unesc sunt produse carteziene . Această teză se află la originea bazelor de date relaționale. Edgar F. Codd a primit premiul Turing în 1981 .
Modelul entitate-asociere a fost inventat de Peter Chen în 1975 ; este destinat clarificării organizării datelor în bazele de date relaționale.
În 1990, baza de date juridică LEADERS, cu actualizări lunare pe computerele clienților, inițial pe dischete și ulterior pe CD-ROM (responsabil pentru René Janray), a fost lansată în Belgia. A fost vândut în 2000 către compania Kluwer. Între timp a adunat aproape 1.000 de clienți, inclusiv cele mai importante magazine și companii. O disertație la sfârșitul studiului la ISAT s-a axat pe acest produs și a fost intitulată Baza de date a liderilor: o descoperire în lumea editării electronice juridice . În 1998, într-o carte dedicată bazelor de date, editorul MARABOUT a dedicat un întreg capitol bazei de date LEADERS.
În modelul relațional, relația desemnează toate informațiile dintr-un tabel, în timp ce asocierea, în modelul entitate-asociere, desemnează legătura logică care există între două tabele care conțin informații conexe.
Primele baze de date s-au bazat pe prezentarea cărților perforate : împărțite în rânduri și coloane cu lățime fixă. O astfel de distribuție face dificilă stocarea obiectelor de programare; în special, ele nu permit moștenirea între entități, caracteristică programării orientate pe obiecte .
Apărute în anii 1990 , bazele de date relaționale obiect utilizează un model de date relațional permițând în același timp stocarea obiectelor. În aceste baze de date, asociațiile de moștenire a obiectelor sunt adăugate asociațiilor dintre entitățile modelului relațional.
Etapele cheie în ciclul de viață al unei baze de date sunt proiectarea și punerea în funcțiune.
Înainte de proiectare, utilizatorii și producătorii de informații sunt intervievați pentru a se familiariza cu caracteristicile informațiilor, cu relațiile dintre informații, precum și cu caracteristicile sistemului informatic care va găzdui baza de date. Obiectivul acestui pas este de a colecta caracteristicile informațiilor în practică și nevoile utilizatorilor și de a le formula într-un mod simplu, ușor de înțeles de către utilizatori, cât și de către administratorii bazei de date.
Apoi, va fi creată o diagramă generală a rețelei de informații și relații, sub forma unei diagrame cuprinzând entități, atribute și relații. Există diferite metode de modelare a datelor, cea mai cunoscută fiind DCM ( Conceptual Data Model ). Acest lucru permite în special stabilirea unei diagrame structurate a tuturor datelor unui sistem informațional, de înțeles de către toți actorii săi (manager de produs, dezvoltator, client dacă este informat ...).
Acest plan este apoi transformat în instrucțiuni formulate în limbajul de comandă al SGBD și instrucțiunile sunt executate pentru a crea structura bazei de date și a o face operațională.
Definirea organizării interne a unei baze de date - modelul său de date fizice - este pasul final al construcției sale. Această operație constă în primul rând în definirea înregistrărilor corespunzătoare modelului de date logice. Înregistrările sunt stocate în fișiere și fiecare fișier conține de obicei un lot de înregistrări similare. În această etapă sunt utilizate diverse tehnici pentru a obține un model care are ca rezultat o viteză adecvată de manipulare a datelor, garantând totodată integritatea datelor.
Calitatea modelului de date fizice are un impact major asupra vitezei operațiunilor bazei de date. O simplă îmbunătățire poate face operațiunile de date de 50 de ori mai rapide, o diferență cu atât mai vizibilă atunci când există o cantitate mare de date. La începutul anilor 2000 , existau baze de date care conțineau mai mulți terabyte (10 12 ) de date și ingineri independenți a căror activitate era doar de a ajuta clienții să-și accelereze bazele de date.
Odată operaționale, operațiunile de monitorizare fac posibilă detectarea problemelor care pot necesita modificări ale schemei. Modificările pot fi făcute și în cazul schimbării nevoilor utilizatorilor.
Organizarea internă a unei baze de date - modelul său de date fizice - include înregistrări corespunzătoare modelului de date logice, indicii și etichete utilizate de SGBD pentru a găsi și manipula datele. Înregistrările sunt stocate în fișiere și fiecare fișier conține de obicei un lot de înregistrări similare. Organizația internă utilizează diverse tehnici menite să atingă o viteză adecvată în manipularea datelor, asigurând totodată integritatea datelor.
Organizarea logică a datelor este independentă de organizarea lor fizică. Aceasta înseamnă că poziția datelor din fișiere poate fi complet modificată fără ca organizarea lor sub forma înregistrărilor din tabele să fie afectată. SGBD organizează fișiere într-un mod care accelerează operațiunile și diferă în funcție de hardware și de sistemul de operare pentru care este conceput sistemul de gestionare a bazelor de date . Înregistrările sunt de obicei grupate în clustere ( cluster englezesc ), a căror dimensiune este aliniată cu o dimensiune optimă pentru hardware ( hard disk-uri ).
Principalele tehnici utilizate în modelul de date fizice sunt indexuri, vizualizări materializate și partiționare. Stocarea datelor este adesea realizată de dispozitivele RAID și SGBD utilizează tehnici precum tabele hash, arborii B, bitmap-uri sau fișiere ISAM:
Index Un index este un set de date menit să accelereze operațiunile de căutare a datelor. Structura indexului cuprinde valori asociate cu pointerele în care fiecare pointer face posibilă găsirea datelor care au această valoare. Vizualizare materializată Într-o vizualizare concretizată , rezultatul unei căutări / agregări este salvat în baza de date, permițând utilizarea acestuia de mai multe ori și economisind timp. Această tehnică este utilizată în special în baze de date analitice și aplicații OLAP . Partiționare În tehnica de partiționare , SGBD distribuie datele între mai multe unități de hard disk, ceea ce accelerează operațiunile prin scăderea cantității de muncă efectuată de fiecare hard disk. RAID (din gama redundantă engleză de discuri ieftine ) În tehnica RAID, un dispozitiv hardware distribuie date între mai multe unități de disc, ceea ce accelerează operațiunile și previne pierderea informațiilor în cazul unei defecțiuni. Acest dispozitiv hardware este utilizat de software ca un hard disk obișnuit; Hash table (în engleză hashing ) În această organizație, o funcție hash este utilizată pentru a transforma, prin calcul aritmetic, orice valoare într-un număr întreg. Numărul obținut este utilizat pentru a determina locația exactă în care vor fi salvate datele acestei valori. Arborele B Arborelui B este o structură de arbore în care toate ramurile au aceeași lungime, iar fiecare nod are între N / 2 și ramuri N. Aceasta este o structură foarte des utilizată pentru indexuri. Bitmap Indicii bitmap sunt adesea utilizați pentru date în care există doar câteva valori posibile (exemplu: sex M / F, ziua săptămânii etc.). Pentru fiecare dintre valorile posibile ale datumului, indexul cuprinde un tabel de biți în care bitul N este la „1” dacă a N-a datum are valoarea în cauză. ISAM ( metoda de acces secvențial indexat ) În această organizație, înregistrările sunt stocate sortate în funcție de cheia primară , într-o structură împărțită în cilindri și piste de dimensiuni fixe. Fiecare piesă are un spațiu liber pentru a permite inserarea de noi înregistrări. O structură de copac conține valoarea cheie și un indicator către prima înregistrare a fiecărei piste. Ziar Un jurnal conține lista ultimelor operațiuni efectuate pe baza de date. Acest jurnal este utilizat de motorul bazei de date pentru a derula operațiunile înapoi, de exemplu în caz de blocare a computerului sau dacă operațiunile conțin o eroare. A se vedea, de asemenea, tranzacții IT .Un sistem de gestionare a bazelor de date este un set de software care manipulează conținutul bazelor de date. Este folosit pentru a efectua operațiuni obișnuite precum găsirea, adăugarea sau ștergerea înregistrărilor ( Creare , citire , actualizare , ștergere CRUD prescurtată ), manipularea indexurilor , crearea sau copierea bazelor de date).
Mecanismele sistemului de gestionare a bazelor de date își propun să asigure coerența, confidențialitatea și durabilitatea conținutului bazelor de date. Software-ul va refuza să permită unui utilizator să modifice sau să șteargă informații dacă nu a fost autorizat anterior; va refuza ca un utilizator să adauge informații dacă există în baza de date și face obiectul unei reguli de unicitate ; va refuza, de asemenea, să stocheze informații care nu respectă regulile de consistență, cum ar fi regulile de integritate referențială în bazele de date relaționale.
Sistemul de gestionare a bazei de date adaptează automat indexurile cu fiecare modificare efectuată la o bază de date și fiecare operațiune este scrisă într-un jurnal conținut în baza de date, care permite anularea sau terminarea operațiunii în sine în caz de blocare a computerului și astfel garantează coerența conținutul bazei de date.
Începând din 2009, IBM DB2 , baza de date Oracle , MySQL , PostgreSQL și Microsoft SQL Server sunt principalele sisteme de gestionare a bazelor de date de pe piață.
Bazele de date sunt din ce în ce mai des puse la dispoziția utilizatorilor lor pe servere, prin internet sau pe servere locale pentru o securitate mai optimă. Accesul este mai mult sau mai puțin sigur.
Unii producători de date (în special autoritățile locale) pun unele dintre bazele lor de date în mod liber la dispoziția tuturor. Datele pe care le dețin în mod legal sau deținătorii cu autorizație de distribuire (de exemplu, fotografii) pot fi accesibile în acest caz sub o licență gratuită (ex CC-BY-SA ), sau uneori întreaga bază de date în sine poate fi accesată sub o licență gratuită licență ( de exemplu, ODBL ). Aceste licențe permit păstrarea proprietății intelectuale asupra conținutului, în timp ce autorizează reutilizarea și transformarea, prin citarea sursei. Există multe alte licențe diferite, mai mult sau mai puțin restrictive.
Una dintre cele mai frecvente utilizări ale computerelor este manipularea datelor. Sectoarele financiar, asigurări, educațional, administrația publică și mass-media, sectoarele majore ale societății informaționale , care furnizează servicii bazate pe informații, utilizează baze de date. Printre domeniile practice de utilizare, există inventare (stocuri, magazine, biblioteci), instrumente de rezervare (zboruri cu avionul, cinematograf etc.), licențiere (conducere, vânătoare, proprietar de câine) ...), resurse umane, salarii, producție industrială ( mașinile de producție sunt adesea computerizate), precum și contabilitatea și facturarea.
Aplicațiile informatice pentru colectarea informațiilor administrative, cum ar fi dosarele medicale, dosarele fiscale sau permisele de transport al armelor, utilizează baze de date.
Într-o aplicație computerizată de ticketing computerizată , biletele de călătorie sau de concert sunt înregistrate într-o bază de date.
În software-ul de contabilitate sau de trezorerie, intrările precum și planul de conturi sunt înregistrate într-o bază de date; raportul este un raport obținut prin sinteză automată a conținutului bazei de date. În mod similar, o aplicație computerizată gestionarea producției asistată de computer (Rep. POAG), starea stocului, disponibilitatea personalului și timpul sunt salvate într-o bază de date și oferă baza pentru un raport de planificare.
În software-ul de ajutor medical pentru diagnostic , un set de patologii și diagnostice este înregistrat într-o bază de date. Un motor de căutare extrage diagnosticele care corespund cel mai bine patologiilor alese de utilizator.
Sistemul de informații Schengen este o aplicație de bază de date utilizată de poliția și serviciile vamale din spațiul Schengen din Europa pentru a colecta și a face schimb de informații judiciare (mandat de arestare, amprente digitale, interdicții de ședere ...).
ITIS este o aplicație pentru computer care conține un catalog de taxonomie a speciilor vii (plante, animale, ciuperci, microorganisme etc.).
CIA , o agenție de informații din Statele Unite, are una dintre cele mai mari baze de date din lume.
Catalogul librăriilor online amazon.com este una dintre cele mai mari baze de date din lume, cu peste 250 de milioane de cărți catalogate. Amazon.com deține, de asemenea , baza de date cu filme IMDb .
Bibliotecile, în special bibliotecile universitare , oferă publicului lor acces la baze de date. Acestea sunt, în general, baze de date care conțin cărți și / sau articole digitale din presa generală sau specializată, furnizate de furnizori externi de servicii. De exemplu, biblioteca Școlii Naționale de Științe și Biblioteci a Informației ( enssib ) oferă acces la 76 de baze de date utilizatorilor săi, inclusiv de la A la Z (presă), Cairn (presă și cărți electronice), Dawsonera (cărți electronice), Électra (bază de date bibliografică) etc. Unele sunt cu acces liber și gratuit, altele sunt doar la fața locului, iar altele sunt la fața locului și acces la distanță. În plus, școala (enssib) produce și pune online propriile baze de date pentru a deservi mai bine comunitatea profesioniștilor din științele informației și biblioteci: bază de construcție a bibliotecilor franceze din 1992 , stagiu și servicii de oferte de locuri de muncă de l'enssib, Base Maguelone: Baza de date cu ornamente tipografice.
În sistemele de informații geografice, informațiile de cartografiere sunt înregistrate într-o bază de date. Informațiile de cartografiere a cerului sunt disponibile în cataloagele de stele .
În grupul de știri sau software - ul de e-mail , mesajele sunt adesea salvate într-o bază de date.
Software- ul antivirus folosește adesea o bază de date în care sunt stocate amprentele lăsate de virușii informatici .
Registrul este o bază de date care conține setările de configurare a sistemelor de operare pentru Windows . Obiect de date Managerul este o bază de date similară cu AIX de operare sisteme .
În software-ul electronic de gestionare a documentelor , documentele electronice sunt stocate într-o bază de date. Într-un sistem de gestionare a conținutului, bucăți dintr-o pagină web sunt stocate într-o bază de date, iar în software-ul de comerț electronic acestea sunt reclamele, precum și agenții de publicitate.
Într-o platformă de e-learning , exercițiile, examenele, planurile de învățământ, precum și directorul profesorilor și cursanților sunt stocate într-o bază de date.
Un ERP precum SAP ERP (de la SAP AG ) constă dintr-un set de software care utilizează toate aceeași bază de date. Diferitele produse software de acest tip se referă la operațiuni comerciale obișnuite, cum ar fi facturarea , contabilitatea , salariul , urmărirea comenzilor și stocurile .