04/08/2025
carVerticalin tietolähteet: Miten historiaraportit luodaan

Asiakkaat ja yhteistyökumppanit kysyvät meiltä usein: miten carVerticalin ajoneuvon historiaraportit luodaan? Mistä tiedot saadaan?
Nämä kysymykset ovat ymmärrettäviä – auton historiaraporteista voi löytyä todella odottamattomia tietoja. Vielä vähän aikaa sitten autonostajien oli luotettava myyjien rehellisyyteen ja mekaanikon asiantuntemukseen saadakseen kunnollisen käytetyn auton.
Niin paljon kuin haluaisimmekin saada taikavoimia, totuus on yksinkertaisempi ja mielenkiintoisempi. Tässä artikkelissa tarkastelemme, miten carVertical-raportit tehdään.
Käytetyillä autoilla on synkkiä salaisuuksia
Paljasta ne kaikki! Anna vain VIN-koodi ja klikkaa painiketta:
VIN-numero: avain ajoneuvon historian avaamiseen

Useimmat carVertical-raportit alkavat Vehicle Identification Number (VIN) -numerolla. Mikä se on ja miten se auttaa meitä?
Lähes jokaisessa vuoden 1981 jälkeen valmistetussa autossa on 17-merkkinen yksilöllinen VIN-numero, joka toimii ajoneuvon sormenjälkenä. Eri laitokset, kuten poliisi, vakuutusyhtiöt ja huoltokeskukset, käyttävät VIN-tunnusta tallentaakseen tärkeimmät tapahtumat auton elämässä. Onnettomuudet, varkaudet, kilometritarkistukset, omistajanvaihdokset ja paljon muuta kirjataan tämän numeron avulla.
Koska elämme digitaalisella aikakaudella, suurin osa näistä tiedoista on tallennettu avoimiin ja yksityisiin tietokantoihin. VIN on avaimemme näiden tietojen hankkimiseen.
Miten carVertical-raportit luodaan: katsaus kulissien taakse

Vaikka raportti on yksinkertainen ja helppo ymmärtää, sen taustalla oleva tekninen prosessi on monimutkainen, dynaaminen ja jatkuvasti kehittyvä. Tässä on katsaus siihen, miten muutamme raakadatan selkeiksi ja käyttökelpoisiksi oivalluksiksi.
1. Tietojen etsiminen VIN:n avulla

Kun syötät VIN-numeron carVertical-sovellukseen tai -sivustolle, teemme automaattisesti haun yli 900 tietolähteestä yli 40 maassa. Näitä ovat mm:
- Lainvalvonta
- Kansalliset poliisin tietokannat
- Rahoituslaitokset
- Kansalliset/osavaltioiden rekisterit
- Luokitellut ilmoitukset
- Voittoa tavoittelemattomat organisaatiot
2. Tietojen suodattaminen ja lajittelu käyttökelpoisiksi paloiksi
Eri lähteistä saamamme tiedot ovat yleensä raakadataa, ja ne vaativat useita käsittelyvaiheita. Käytetään esimerkkiä tämän menettelyn havainnollistamiseksi:

Kuvittele, että saamme ruotsalaisen asiakirjan mustasta Mercedes-Benz GLC 300:sta, jonka matkamittarissa on 5 000 Skandinavian mailia (50 000 km) ja joka on päivätty 12. kesäkuuta 2021. Ennen kuin voimme käyttää tätä tietoa, meidän täytyy:
- Korjata mahdolliset virheet/epäjohdonmukaisuudet. Tiedot syötetään usein manuaalisesti järjestelmiin, mikä johtaa kirjoitus- tai muihin virheisiin.
- Kääntää tiedot tarvittaessa.
- Lajitella tiedot asianmukaisiin luokkiin, kuten:
- Merkintäpäivä: 12. kesäkuuta 2021
- Maa: Ruotsi
- Valmistusvuosi: 2020
- Merkki: Mercedes-Benz
- Malli: GLC 300
- Väri: Musta
- Matkamittarilukema: 5 000
- Matkamittarin yksikkö: Skandinavian mailit
Voimme nyt ryhmitellä nämä tiedot muiden löydettyjen tietojen kanssa ja käyttää niitä raportin luomiseen.
3. Lajiteltujen tietojen sijoittaminen asianmukaisiin raporttiosioihin
Tarkastellaan tarkemmin, miten tiedot tulevat osaksi carVertical-raporttia, ja tarkastellaan samaa mustaa Mercedestä.
Edellä olevasta asiakirjasta tiedämme, että matkamittarissa oli 50 000 kilometriä, kun nämä tiedot kirjattiin.
Syy siihen, miksi ”me” (eli carVertical-järjestelmä) tiedämme tämän, on se, että olemme analysoineet asiakirjan ja eristäneet nämä kolme tietoa: ”Matkamittarilukema: 5 000”, "Matkamittarin yksikkö: Skandinavian mailit” ja ”Merkintäpäivä: 12. kesäkuuta 2021".
Kuvitellaan nyt, että olemme löytäneet 2 muuta merkintää tästä Mercedeksestä, jotka sisältävät seuraavat tiedot:
- Asiakirja #1:
- Tietueen maa: Ruotsi
- Matkamittari: 187 000 km
- Rekisteröintipäivä: 20. lokakuuta 2022
- Asiakirja #2:
- Tietueen maa: Suomi
- Katsastuksen päivämäärä: 7. syyskuuta 2023
- Matkamittari: 105 000 km
- CO2-päästöt: [x g/km]

Nämä tiedot kertovat melkoisen tarinan – meidän on vain koottava ne yhteen.
Tätä varten ryhmittelemme tietotyypit raporttiosioihin. Meillä on esimerkiksi 3 matkamittarin lukemaa ja niiden mittauspäivämäärät. Nämä näkyvät raportin Matkamittari-osiossa. Samaan aikaan katsastusta koskevat tiedot ovat Oikeudellinen tila ja Aikajana-osiossa, jne.
4. Tilastollisten mallien käyttäminen oivallusten tuottamiseen ja korjausten tekemiseen
Meillä on nyt tiedot, ja ne on käsitelty carVertical-raporttia varten. Mutta ”konepellin alla” on vielä paljon työtä tehtävänä – pääasiassa tilastollisten mallien ja muiden teknisten ratkaisujen avulla ongelmien korjaamiseksi ja raportin rikastuttamiseksi.

Näiden tekniikoiden käyttökohteita on liikaa lueteltavaksi, mutta esimerkkinä mainittakoon, että käytämme tilastollisia malleja tarjotaksemme käyttäjille lisätietoa (voimme esimerkiksi verrata esimerkkimercedeksemme ajokilometrejä muihin saman mallisiin, samanikäisiin jne. autoihin).

Tämä prosessi toimii molempiin suuntiin: käytämme tilastollisia malleja rikastuttaaksemme nykyistä raporttia, ja käytämme nykyisen raportin tietoja rikastuttaaksemme tilastollisia mallejamme.
5. Raportin luominen
Tässä vaiheessa kaikki keräämämme, suodattamamme, lajittelemamme ja rikastamamme tiedot käytetään carVertical-raportin luomiseen. Palataan vielä viimeiseen esimerkkiin Mercedeksestä. Tällaiselta sen Matkamittari-osio voisi näyttää:

Vaikka tämä musta Mercedes saattaa vaikuttaa houkuttelevalta, yllä oleva kuvaaja saa potentiaalisen ostajan miettimään kahdesti!
Raportista käyttäjät saisivat myös tietoa auton matkasta – se saapui Ruotsiin, myytiin toiselle omistajalle Ruotsissa ja päätyi lopulta Suomeen. Tilastollisten mallien avulla voimme myös tarjota tämän automallin hintaluokan sekä keskimääräisen ajokilometrimäärän kuvaajan (vaikkakaan jälkimmäinen ei juuri muuttuisi, kun otetaan huomioon ajokilometrien palautus!) ja paljon muuta.
Tarkista VIN-numerosi
Vältä kalliit ongelmat tarkistamalla ajoneuvosi historia. Saat raportin heti!
Vahingot, mittarilukemat ja kaikki muu: Mitkä tiedot ovat peräisin mistäkin lähteistä?
Ilman, että käsittelemme raportissamme tiettyjä tietokantoja tai tietolähteitä, voimme tarkastella joitakin yleisiä sääntöjä siitä, mistä tietyntyyppiset tiedot voivat olla peräisin.
Sitä ennen on kuitenkin tärkeää ymmärtää pari asiaa:
- Samantyyppinen tieto voi olla peräisin erityyppisistä lähteistä. Esimerkiksi ajokilometritiedot (jopa sama merkintä) voivat olla peräisin huoltokäynniltä, poliisin tiedoista tai muualta.
- Maittain on paljon vaihtelua. Samantyyppisillä laitoksilla voi olla erilaiset kirjanpitotehtävät järjestelmissä maasta riippuen.
Mistä nämä vahinkotiedot, matkamittarin lukemat ja muut tiedot sitten löytyvät?

carVertical on ISO/IEC 27001:2017 -sertifioitu
Yrityksenä, joka käsittelee paljon tietoja, suhtaudumme turvallisuuteen erittäin vakavasti. Osoituksena sitoutumisestamme carVertical on saanut ISO/IEC 27001:2017 -sertifikaatin, joka on tietoturvan maailmanlaajuinen standardi.
Mitä tämä tarkoittaa?
Saadakseen ISO/IEC 27001:2017 -sertifikaatin yrityksen on otettava käyttöön työkaluja ja menettelyjä, joilla suojataan kaikki vastaanotetut, lähetetyt, luodut, hallinnoidut ja käytetyt suulliset, kirjalliset ja sähköiset tiedot kaikilta mahdollisilta uhkilta: ulkoisilta, sisäisiltä, tahallisilta tai tahattomilta.
Sertifikaatti tarkoittaa, että olemme ottaneet käyttöön tiukat toimenpiteet, joilla suojaamme kaikki suulliset, kirjalliset ja sähköiset tiedot kaikilta uhkilta, olivatpa ne sitten ulkoisia, sisäisiä, tahattomia tai tahallisia.
Mitä tämä tarkoittaa sinulle? Henkilökohtaiset tietosi, raporttitietosi ja taloudelliset tietosi ovat kaikki suojattu huippuluokan turvajärjestelmillä. Haluatko lisätietoja? Tutustu tietoturvapolitiikkaamme ja tietoturvallisuuden hallintajärjestelmäämme (ISMS).
Tutustu carVerticalin datatiimiin!

carVertical-raportti on yksinkertainen ja helppolukuinen, mutta sen yksinkertaisuuteen liittyy monia tekijöitä. Dataosastomme on hyvä osoitus tästä: carVerticalilla on tällä hetkellä lähes 200 työntekijää, ja heistä jopa 15 % työskentelee datan parissa.
Se on huomattava määrä ihmisiä, jotka ovat hyviä matematiikassa!
Osastolla on 4 erityisryhmää:
- Data Acquisition keskittyy raakadatan keräämiseen
- Data Engineering vastaa datainfrastruktuurin ja dataputkien rakentamisesta ja ylläpidosta
- Machine Learning Engineering kehittää ja ottaa käyttöön koneoppimismalleja
- Data Analytics analysoi dataa poimiakseen oivalluksia ja tehdäkseen liiketoimintapäätöksiä
Jokaisella näistä tiimeistä on ratkaiseva rooli carVertical-raportin laatimisessa – meitä ei kirjaimellisesti olisi olemassa ilman heitä!