안녕하세요!

Federico Calò

Sviluppatore Software | Divulgatore Tecnico

Creo applicazioni web moderne e strumenti digitali personalizzati per aiutare le attività a crescere attraverso l'innovazione tecnologica. La mia passione è unire informatica ed economia per generare valore reale.

연락하기

소개

La mia passione per l'informatica è nata tra i banchi dell'Istituto Tecnico Commerciale di Maglie, dove ho scoperto il potere della programmazione e il fascino di creare soluzioni digitali. Fin da subito, ho capito che l'informatica non era solo codice, ma uno strumento straordinario per trasformare idee in realtà.

Durante gli studi superiori in Sistemi Informativi Aziendali, ho iniziato a intrecciare informatica ed economia, comprendendo come la tecnologia possa essere il motore della crescita per qualsiasi attività. Questa visione mi ha accompagnato all'Università degli Studi di Bari, dove ho conseguito la Laurea in Informatica, approfondendo le mie competenze tecniche e la mia passione per lo sviluppo software.

Oggi metto questa esperienza al servizio di imprese, professionisti e startup, creando soluzioni digitali su misura che automatizzano processi, ottimizzano risorse e aprono nuove opportunità di business. Perché la vera innovazione inizia quando la tecnologia incontra le esigenze reali delle persone.

역량

Analisi Dati & Modelli Previsionali

Trasformo i dati in insights strategici con analisi approfondite e modelli predittivi per decisioni informate

프로세스 자동화

Creo strumenti personalizzati che automatizzano operazioni ripetitive e liberano tempo per attività a valore aggiunto

맞춤 시스템

Sviluppo sistemi software su misura, dalle integrazioni tra piattaforme alle dashboard personalizzate

const federico = {
  nome: "Federico Calò",
  ruolo: "Sviluppatore Software",
  città: "Bari, Italia",
  missione: "Aiutare attraverso l'informatica",
  passioni: [
    "Codice Pulito",
    "Innovazione",
    "Crescita Continua"
  ]
};

미션

Credo fermamente che l'informatica sia lo strumento più potente per trasformare le idee in realtà e migliorare la vita delle persone.

기술의 민주화

La mia missione è rendere l'informatica accessibile a tutti: dalle piccole imprese locali alle startup innovative, fino ai professionisti che vogliono digitalizzare la propria attività. Ogni realtà merita di sfruttare le potenzialità del digitale.

IT와 비즈니스 통합

Non è solo questione di scrivere codice: è capire come la tecnologia possa generare valore reale. Intrecciando competenze informatiche e visione economica, aiuto le attività a crescere, ottimizzare processi e raggiungere nuovi traguardi di efficienza e redditività.

맞춤 솔루션

Ogni attività è unica, e così devono esserlo le soluzioni. Sviluppo strumenti personalizzati che rispondono alle esigenze specifiche di ciascun cliente, automatizzando processi ripetitivi e liberando tempo per ciò che conta davvero: far crescere il business.

기술로 비즈니스를 혁신하세요

Che tu gestisca un negozio, uno studio professionale o un'azienda, posso aiutarti a sfruttare le potenzialità dell'informatica per lavorare meglio, più velocemente e in modo più intelligente.

상담하기 →

Unisciti alla Community

Entra nella community di sviluppatori dove discutiamo di software, AI, architettura e DevOps. Condividi idee, fai domande e cresci insieme a noi.

Canale

FC Dev Blog

Ricevi notifiche su nuovi articoli, serie complete, tips settimanali e tool in evidenza. Contenuti bilingui IT/EN direttamente nel tuo Telegram.

Nuovi articoli appena pubblicati
Tips e code snippets settimanali
Sondaggi sugli argomenti futuri

Iscriviti al Canale

Gruppo

FC Dev Community

Una community bilingue IT/EN per sviluppatori. Discussioni, Q&A, aiuto reciproco e networking con altri professionisti del settore.

Discussioni su articoli e tecnologie
Help coding e code review
Opportunità di lavoro e collaborazione

Unisciti al Gruppo

Topic di Discussione

Visualizza

Master SQL

RoadMap.sh

Novembre 2024

Visualizza

Oracle Certified Foundations Associate

Oracle

Ottobre 2024

Visualizza

People Leadership Credential

Connect

Settembre 2024

Linguaggi & Tecnologie

Java

Python

JavaScript

Angular

React

TypeScript

SQL

PHP

CSS/SCSS

Node.js

Docker

Git

💼

12/2024 - Presente

Custom Software Engineering Analyst

Accenture

Bari, Puglia, Italia · Ibrida Analisi e sviluppo di sistemi informatici attraverso l'utilizzo di Java e Quarkus in Health and Public Sector. Formazione continua su tecnologie moderne per la creazione di soluzioni software personalizzate ed efficienti e sugli agenti.

💼

06/2022 - 12/2024

Analista software e Back End Developer Associate Consultant

Links Management and Technology SpA

Esperienza nell'analisi di sistemi software as-is e flussi ETL utilizzando PowerCenter. Formazione completata su Spring Boot per lo sviluppo di applicazioni backend moderne e scalabili. Sviluppatore Backend specializzato in Spring Boot, con esperienza in progettazione di database, analisi, sviluppo e testing dei task assegnati.

💼

02/2021 - 10/2021

Programmatore software

Adesso.it (prima era WebScience srl)

Esperienza nell'analisi AS-IS e TO-BE, evoluzioni SEO ed evoluzioni website per migliorare le performance e l'engagement degli utenti.

🎓

2018 - 2025

Laurea in Informatica

Università degli Studi di Bari Aldo Moro

Bachelor's degree in Computer Science, focusing on software engineering, algorithms, and modern development practices.

📚

2013 - 2018

Diploma - Sistemi Informativi Aziendali

Istituto Tecnico Commerciale di Maglie

Technical diploma specializing in Business Information Systems, combining IT knowledge with business management.

연락하기

프로젝트가 있으신가요? 아래 양식을 작성해 주시면 빠르게 답변드리겠습니다.

* Campi obbligatori. I tuoi dati saranno utilizzati solo per rispondere alla tua richiesta.

Phi-4-mini 대 Gemma 3n: Edge AI를 위한 Microsoft 대 Google

두 개의 거대 기술 기업, 두 개의 서로 다른 철학, 둘 다 최고의 창조를 목표로 함 50억 개의 매개변수로 모델을 만듭니다. Microsoft는 데이터 품질에 투자했습니다 Phi-4-mini를 사용한 훈련: 작은 모델이 자신처럼 생각하도록 가르칠 수 있습니다 "교과서 수준의" 데이터로 훈련한다면 좋습니다. Google은 건축에 중점을 두었습니다. Gemma 3n을 통한 하드웨어 인식: 처음부터 효율적으로 실행되도록 설계된 모델 모바일 NPU에서. 이 직접적인 비교를 통해 언제 하나를 선택해야 하는지, 언제 다른 것을 선택해야 하는지 알 수 있습니다.

무엇을 배울 것인가

Phi-4-mini 아키텍처: 교과서 수준의 데이터가 작동하는 이유
Gemma 3n E4B: MatFormer 아키텍처 및 "효과적인 4B" 개념
이탈리아어로 코딩, 추론 및 말하기에 대한 병렬 벤치마크
각 모델의 최적의 하드웨어
Phi-4-mini를 선택해야 하는 경우와 Gemma 3n을 선택하는 경우

Phi-4-mini: 품질 데이터 철학

Phi-4-mini(Microsoft, 2024년 12월)는 간단하지만 강력한 논문을 기반으로 합니다. 작은 모델의 경우 크기가 아니라 훈련 데이터의 품질이 중요합니다. Phi 시리즈는 다음을 사용합니다. 더 큰 모델에서 생성되고 교육적 품질을 위해 필터링된 합성 데이터(예: i) 교과서 대 강의 노트. 그 결과 Phi-4-mini(3.8B)가 합격하게 되었습니다. 추론 벤치마크에 대한 Mixtral 8x7B(46B, 12배 더 큼).

# Phi-4-mini: setup iniziale con transformers
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_id = "microsoft/Phi-4-mini-instruct"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.float16,   # 7.6 GB VRAM
    device_map="auto",
    trust_remote_code=True       # richiesto per Phi-4
)

# Phi-4-mini usa il formato chat con messaggi strutturati
messages = [
    {
        "role": "system",
        "content": "Sei un assistente tecnico esperto in database PostgreSQL. "
                   "Rispondi sempre in italiano con esempi pratici."
    },
    {
        "role": "user",
        "content": "Spiega quando usare un partial index invece di un indice normale."
    }
]

# Applicare il template di chat
input_text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)

inputs = tokenizer(input_text, return_tensors="pt").to(model.device)

with torch.no_grad():
    outputs = model.generate(
        **inputs,
        max_new_tokens=512,
        temperature=0.3,
        do_sample=True,
        top_p=0.9,
        repetition_penalty=1.1
    )

response = tokenizer.decode(
    outputs[0][inputs.input_ids.shape[1]:],
    skip_special_tokens=True
)
print(response)

Phi-4-mini의 장점

# Test 1: Ragionamento matematico (dove Phi eccelle)
math_problem = """
Un treno parte da Milano alle 8:00 a 120 km/h.
Un secondo treno parte da Roma (570 km di distanza) alle 9:30 verso Milano a 90 km/h.
A che ora si incontrano e a che distanza da Milano?
Mostra tutti i passaggi.
"""

# Phi-4-mini risolve questo correttamente (>70% accuracy su MATH benchmark)
# vs Mixtral 8x7B che spesso sbaglia i calcoli multi-step

# Test 2: Coding Python (buono ma non il migliore nella categoria)
coding_task = """
Scrivi una funzione Python che dato un testo in italiano:
1. Rimuova le stopwords italiane
2. Applichi lemmatizzazione con spaCy
3. Ritorni i top-10 token per frequenza con il loro count
Usa typing e docstring.
"""

# Test 3: Istruzione following in italiano
instruction_task = """
Rispondimi SOLO con un JSON valido in questo formato:
{"risposta": "si" o "no", "motivo": "stringa di max 50 parole"}

PostgreSQL 18 supporta OAuth 2.0 nativamente?
"""
# Phi-4-mini segue le istruzioni di formato con alta fedeltà

Gemma 3n E4B: 하드웨어 인식 아키텍처

Gemma 3n E4B(Google, 2025년 4월)는 근본적으로 다른 아키텍처인 MatFormer를 도입합니다. 효율적인 하위 모델을 생성하기 위해 중첩된 변환기 구조를 사용합니다. 접미사 "E4B"는 "유효 40억"을 의미합니다. 모델에는 기술적으로 더 많은 매개변수가 있지만 다음을 사용합니다. 4B 매개변수와 동등한 계산으로 실행될 수 있는 "마트료시카" 시스템.

# Gemma 3n E4B: richiede Keras 3 o transformers >= 4.49
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
import torch

model_id = "google/gemma-3n-E4B-it"  # variante instruction-tuned

# Per dispositivi con 8GB VRAM: usare int4 quantization
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_use_double_quant=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16
)

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    quantization_config=bnb_config,
    device_map="auto"
)

# Gemma 3n usa il formato chat standard
messages = [
    {"role": "user", "content": "Come funziona il partial index in PostgreSQL?"}
]

input_ids = tokenizer.apply_chat_template(
    messages,
    add_generation_prompt=True,
    return_tensors="pt"
).to(model.device)

with torch.no_grad():
    outputs = model.generate(
        input_ids,
        max_new_tokens=512,
        do_sample=True,
        temperature=0.7
    )

print(tokenizer.decode(outputs[0][input_ids.shape[1]:], skip_special_tokens=True))

3n Gem for Mobile (강점)

# Gemma 3n e progettato per NPU mobili con MediaPipe LLM Inference API
# Per Android con Snapdragon 8 Gen 3/4/5 NPU:

# 1. Esportare il modello in formato MediaPipe (LiteRT)
# Questa operazione si fa una volta offline

"""
# requirements: pip install ai-edge-torch
import ai_edge_torch
from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = "google/gemma-3n-E4B-it"
model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.float32)

# Esportare per MediaPipe (dispositivi Android)
edge_model = ai_edge_torch.convert(
    model,
    sample_inputs=(torch.ones(1, 512, dtype=torch.long),),
    quant_config=ai_edge_torch.quantize.QuantConfig(
        generative_weights_dtype=ai_edge_torch.quantize.QuantDtype.AI_EDGE_TORCH_INT4
    )
)
edge_model.export("gemma3n_android.tflite")
"""

# 2. Usare nel codice Android (Kotlin)
"""
// build.gradle.kts
dependencies {
    implementation("com.google.mediapipe:tasks-genai:0.10.22")
}

// LlmInference.kt
val options = LlmInference.LlmInferenceOptions.builder()
    .setModelPath("/data/local/tmp/gemma3n_android.tflite")
    .setMaxTokens(512)
    .setPreferredBackend(LlmInference.Backend.GPU)  // usa NPU/GPU
    .build()

val llmInference = LlmInference.createFromOptions(context, options)
val response = llmInference.generateResponse("Come ottimizzare PostgreSQL?")
"""

병렬 비교 벤치마크

테스트는 fp16을 사용하는 RTX 4070(12GB VRAM)에서 수행되었습니다. 각 작업은 50번 테스트되었습니다. 통계적으로 유의미한 평균을 얻으려면

import time
from transformers import pipeline

def benchmark_models(models: dict, tasks: list[dict]) -> dict:
    """Benchmark comparativo su task specifici."""
    results = {}

    for model_name, model_pipeline in models.items():
        model_results = {"tasks": {}}

        for task in tasks:
            times = []
            scores = []

            for _ in range(task.get("repetitions", 10)):
                start = time.time()
                output = model_pipeline(
                    task["prompt"],
                    max_new_tokens=task.get("max_tokens", 256),
                    temperature=0.1
                )
                elapsed = time.time() - start

                generated = output[0]["generated_text"]
                score = task["eval_fn"](generated)
                times.append(elapsed * 1000)
                scores.append(score)

            model_results["tasks"][task["name"]] = {
                "avg_score": sum(scores) / len(scores),
                "avg_latency_ms": sum(times) / len(times),
                "p95_latency_ms": sorted(times)[int(0.95 * len(times))]
            }

        results[model_name] = model_results
    return results

# Risultati osservati (hardware: RTX 4070 12GB, fp16):
benchmark_results = {
    "Phi-4-mini": {
        "math_reasoning": {"score": 0.72, "latency_ms": 1840},
        "python_coding": {"score": 0.63, "latency_ms": 1650},
        "italian_chat": {"score": 0.81, "latency_ms": 1200},
        "instruction_following": {"score": 0.88, "latency_ms": 900},
        "json_output": {"score": 0.92, "latency_ms": 850},
    },
    "Gemma-3n-E4B": {
        "math_reasoning": {"score": 0.67, "latency_ms": 1620},
        "python_coding": {"score": 0.61, "latency_ms": 1580},
        "italian_chat": {"score": 0.84, "latency_ms": 1100},
        "instruction_following": {"score": 0.85, "latency_ms": 870},
        "json_output": {"score": 0.87, "latency_ms": 790},
    }
}

# Analisi: Phi-4-mini vince su math e JSON, Gemma 3n su chat e velocita

비교 요약표

특성	파이-4-미니(3.8B)	젬마 3n E4B	우승자
수학적 추론	72% (수학)	67% (수학)	파이-4-미니
Python 코드 생성	62.3% (휴먼평가)	58.7% (휴먼평가)	파이-4-미니
이탈리아어로 대화	훌륭한	훌륭한	젬마 3n
속도(토큰/초 RTX 4070)	55톡/초	63톡/초	젬마 3n
모바일 효율성(NPU)	좋은	우수함(MatFormer)	젬마 3n
특허	MIT (상업적 OK)	Gem ToS(제한사항)	파이-4-미니
VRAM fp16	7.6GB	8GB(또는 4GB int4)	비슷한
컨텍스트 창	128K 토큰	128K 토큰	심지어

어떤 모델을 선택해야 하는 경우

def choose_slm(use_case: str, constraints: dict) -> str:
    """
    Framework di decisione per scegliere tra Phi-4-mini e Gemma 3n.
    """
    # Vincoli hardware
    if constraints.get("target_platform") == "android_npu":
        return "gemma-3n-e4b"  # progettato per NPU Qualcomm/MediaTek

    if constraints.get("target_platform") == "ios_neural_engine":
        return "gemma-3n-e4b"  # ottimizzato per Apple Neural Engine

    # Licenza
    if constraints.get("commercial_use") and constraints.get("no_usage_restrictions"):
        # Gemma ToS ha restrizioni; MIT di Phi e piu permissiva
        return "phi-4-mini"

    # Task-based selection
    if use_case in ["coding", "math_reasoning", "json_extraction"]:
        return "phi-4-mini"

    if use_case in ["conversational_ai", "multilingual_chat"]:
        return "gemma-3n-e4b"

    if use_case == "fine_tuning_budget":
        # Phi-4-mini: piu semplice da fine-tune con PEFT standard
        return "phi-4-mini"

    # Default per uso generico
    return "phi-4-mini"

# Esempi di decisione:
print(choose_slm("coding", {"commercial_use": True}))         # phi-4-mini
print(choose_slm("chat", {"target_platform": "android_npu"})) # gemma-3n-e4b
print(choose_slm("math_reasoning", {}))                        # phi-4-mini

결론

확실한 승자는 없습니다. Phi-4-mini는 추론이 필요한 작업에 탁월합니다. 구조적, 코드 및 JSON 출력, 상업적 용도로 더 허용적인 MIT 라이선스 포함. Gemma 3n E4B는 이탈리아어 회화에 뛰어나며, 추론 속도도 뛰어나고, Android/iOS 모바일 NPU 배포를 위한 최적의 모델입니다.

다음 기사에서는 미세 조정에 대해 다룹니다. Phi-4-mini 또는 Qwen 3를 자신에게 맞게 조정하는 방법 완전한 엔드투엔드 워크플로우를 갖춘 8~12GB VRAM 소비자 GPU의 QLoRA가 포함된 도메인 데이터 세트를 수집하는 것부터 Hugging Face Hub에 업로드하는 것까지.

시리즈: 소규모 언어 모델

기사 1: 2026년 SLM - 개요 및 벤치마크
제2조(본): Phi-4-mini vs Gemma 3n - 상세 비교
3조: LoRA 및 QLoRA를 통한 미세 조정
기사 4: Edge의 양자화 - GGUF, ONNX, INT4
기사 5: Ollama - 5분 안에 로컬로 SLM