News | The AI Beacon

News — aggregated AI coverage from 30+ publications

4651. AI Agents Are Here. What Now? (huggingface.co) huggingface.co · 1 year ago | discuss
4652. CO₂ Emissions and Models Performance: Insights from the Open LLM Leaderboard (huggingface.co) huggingface.co · 1 year ago | discuss
4653. Controlling Language Model Generation with NVIDIA's LogitsProcessorZoo (huggingface.co) huggingface.co · 1 year ago | discuss
4654. FACTS Grounding: A new benchmark for evaluating the factuality of large language models (deepmind.google) deepmind.google · 1 year ago | discuss
4655. OpenAI o1 and new tools for developers (openai.com) openai.com · 1 year ago | discuss
4656. Court case: Musk v. OpenAI regarding for-profit structure (openai.com) openai.com · 1 year ago | discuss
4657. Sora: Video generation model now available (openai.com) openai.com · 1 year ago | discuss
4658. Sora System Card (openai.com) openai.com · 1 year ago | discuss
4659. [OpenAI] o1 System Card: Safety evaluation and red teaming report (openai.com) openai.com · 1 year ago | discuss
4660. How good are LLMs at fixing their mistakes? A chatbot arena experiment with Keras and TPUs (huggingface.co) huggingface.co · 1 year ago | discuss
4661. Morgan Stanley's use of AI in financial services evaluation (openai.com) openai.com · 1 year ago | discuss
4662. Rethinking LLM Evaluation with 3C3H: AraGen Benchmark and Leaderboard (huggingface.co) huggingface.co · 1 year ago | discuss
4663. Investing in Performance: Fine-tune small models with LLM insights - a CFM case study (huggingface.co) huggingface.co · 1 year ago | discuss
4664. Open Source Developers Guide to the EU AI Act (huggingface.co) huggingface.co · 1 year ago | discuss
4665. Advancing red teaming with people and AI (openai.com) openai.com · 1 year ago | discuss
4666. Introducing the Open Leaderboard for Japanese LLMs! (huggingface.co) huggingface.co · 1 year ago | discuss
4667. Letting Large Models Debate: The First Multilingual LLM Debate Competition (huggingface.co) huggingface.co · 1 year ago | discuss
4668. Judge Arena: Benchmarking LLMs as Evaluators (huggingface.co) huggingface.co · 1 year ago | discuss
4669. Share your open ML datasets on Hugging Face Hub! (huggingface.co) huggingface.co · 1 year ago | discuss
4670. [NTIA] OpenAI comments on data center growth, resilience, and security (openai.com) openai.com · 1 year ago | discuss
4671. Expert Support case study: Bolstering a RAG app with LLM-as-a-Judge (huggingface.co) huggingface.co · 1 year ago | discuss
4672. Introducing HUGS - Scale your AI with Open Models (huggingface.co) huggingface.co · 1 year ago | discuss
4673. Hugging Face Teams Up with Protect AI: Enhancing Model Security for the ML Community (huggingface.co) huggingface.co · 1 year ago | discuss
4674. Scaling AI-based Data Processing with Hugging Face + Dask (huggingface.co) huggingface.co · 1 year ago | discuss
4675. OpenAI and Hearst Content Partnership (openai.com) openai.com · 1 year ago | discuss
4676. Introducing the Open FinLLM Leaderboard (huggingface.co) huggingface.co · 1 year ago | discuss
4677. A Short Summary of Chinese AI Global Expansion (huggingface.co) huggingface.co · 1 year ago | discuss
4678. New funding to scale the benefits of AI (openai.com) openai.com · 1 year ago | discuss
4679. 🇨🇿 BenCzechMark - Can your LLM Understand Czech? (huggingface.co) huggingface.co · 1 year ago | discuss
4680. Exploring the Daily Papers Page on Hugging Face (huggingface.co) huggingface.co · 1 year ago | discuss

← prev next →