Étiquette : open data (Page 1 of 2)

See the websites that make AI bots like ChatGPT sound so smart

Google’s C4 dataset

“AI chatbots have exploded in popularity over the past four months, stunning the public with their awesome abilities, from writing sophisticated term papers to holding unnervingly lucid conversations. Chatbots cannot think like humans: They do not actually understand what they say. They can mimic human speech because the artificial intelligence that powers them has ingested a gargantuan amount of text, mostly scraped from the internet.
This text is the AI’s main source of information about the world as it is being built, and influences how it responds to users. If it aces the law school admissions test, for example, it’s probably because its training data included thousands of LSAT practice sites. Tech companies have grown secretive about what they feed the AI. So The Washington Post set out to analyze one of these data sets to fully reveal the types of proprietary, personal, and often offensive websites that go into an AI’s training data.”

Source : See the websites that make AI bots like ChatGPT sound so smart – Washington Post

Stability AI Launches the First of its StableLM Suite of Language Models — Stability AI

https://i0.wp.com/www.beaude.net/no-flux/wp-content/uploads/2023/04/newparrot.png?resize=676%2C676&ssl=1

“Today, Stability AI released a new open-source language model, StableLM. The Alpha version of the model is available in 3 billion and 7 billion parameters, with 15 billion to 65 billion parameter models to follow. Developers can freely inspect, use, and adapt our StableLM base models for commercial or research purposes, subject to the terms of the CC BY-SA-4.0 license.”

Source : Stability AI Launches the First of its StableLM Suite of Language Models — Stability AI

Rapports sur la mobilité de la communauté – COVID-19

https://i0.wp.com/www.beaude.net/no-flux/wp-content/uploads/2020/11/image.png?resize=676%2C355&ssl=1

“Les rapports sur la mobilité de la communauté sont destinés à fournir des renseignements sur les changements induits par les politiques de lutte contre le COVID-19. Ils présentent sous forme de graphiques les tendances de déplacement au fil du temps par zone géographique, mais aussi par catégorie de lieux, par exemple les commerces et espaces de loisirs, les magasins d’alimentation et pharmacies, les parcs, les arrêts de transports en commun, les lieux de travail et les lieux de résidence.”

Source : Rapports sur la mobilité de la communauté – COVID-19

COVID‑19 – Rapports sur les tendances de mobilité – Apple

covid19 apple mobility

“Découvrez les tendances en matière de mobilité en période de COVID-19. Les rapports sont publiés quotidiennement et reflètent les demandes d’itinéraires effectuées sur Apple Plans. La confidentialité est l’une de nos valeurs fondamentales. L’app Plans n’associe pas vos données à votre identifiant Apple, et Apple ne conserve pas d’historique de vos trajets.”

Source : COVID‑19 – Rapports sur les tendances de mobilité – Apple

DVF - Etalab

“Cette application est proposée par la mission Etalab et permet de visualiser les données DVF (demandes de valeurs foncières), correspondant aux mutations à titre onéreux réalisées les 5 dernières années. Les données DVF brutes sont téléchargeables sur le site https://www.data.gouv.fr depuis le 24 avril 2019 et sont produites par la Direction générale des Finances publiques.”

Source : DVF

comparaison avant et après la prise en compte des délégations

“Depuis le printemps 2018, l’Assemblée publie donc au sein des relevés en ligne et en open data le détail des votes individuels ainsi que l’usage ou non d’une délégation. Après un long travail méthodologique sur ces données par nos membres bénévoles, NosDéputés.fr prend désormais en compte la participation aux scrutins dans l’indicateur des semaines d’activité et dans le graphique des députés pour les scrutins concernés, soit à compter de février 2018”.

Source : Grâce aux progrès de la transparence à l’Assemblée, NosDéputés.fr reflète encore plus fidèlement l’activité des parlementaires « Regards Citoyens

“There are many thousands of data repositories on the web, providing access to millions of datasets; and local and national governments around the world publish their data as well. To enable easy access to this data, we launched Dataset Search, so that scientists, data journalists, data geeks, or anyone else can find the data required for their work and their stories, or simply to satisfy their intellectual curiosity“.

Source : Dataset Search

«The most basic problem is that researchers often don’t share their source code. At the AAAI meeting, Odd Erik Gundersen, a computer scientist at the Norwegian University of Science and Technology in Trondheim, reported the results of a survey of 400 algorithms presented in papers at two top AI conferences in the past few years. He found that only 6% of the presenters shared the algorithm’s code. Only a third shared the data they tested their algorithms on, and just half shared « pseudocode »—a limited summary of an algorithm. (In many cases, code is also absent from AI papers published in journals, including Science and Nature.)».

Source : Missing data hinder replication of artificial intelligence studies | Science | AAAS

«A ce jour, en France, les bases de données juridiques en libre accès sont encore incomplètes, mais une loi votée fin 2016 va bientôt imposer à toutes les juridictions de publier intégralement leurs décisions et les textes annexes. Le big data judiciaire pourra alors se déployer pleinement».

Source : Des « juges virtuels » pour désengorger les tribunaux

« Older posts

© 2024 no-Flux

Theme by Anders NorenUp ↑