Konfliktusvezérelt klóztanulás

Az informatikában a konfliktusvezérelt klóztanulás (CDCL) a logikai kielégítési probléma (SAT) megoldására szolgáló algoritmus. Adott egy logikai képlet, a SAT-probléma változók hozzárendelését kéri, hogy a teljes képlet igaz legyen. A CDCL SAT megoldók belső működését a DPLL megoldók ihlették. A fő különbség a CDCL és a DPLL között az, hogy a CDCL visszaugrása nem kronologikus.

A konfliktusvezérelt klózok tanulását Marques-Silva és Sakallah (1996, 1999),^[1]^[2] valamint Bayardo és Schrag (1997) javasolta.^[3]

Háttér

Logikai kielégítési probléma

Sablon:Bővebben A kielégítési probléma abban áll, hogy egy adott képlethez megfelelő hozzárendelést találunk konjunktív normál formában (CNF).

( ( nem A ) vagy ( nem C ) ) és ( B vagy C ),

vagy egy általános jelöléssel:^[4]

(\neg A \lor \neg C) \land (B \lor C)

ahol A, B, C logikai változók, $\neg A$ , $\neg C$ , $B$ , és $C$ litárlok, és $\neg A \lor \neg C$ és $B \lor C$ klózok.

A = F a l s e, B = F a l s e, C = T r u e

mivel igazzá teszi az első klózt (hiszen $\neg A$ igaz), valamint a másodikat (mivel $C$ igaz).

Ez a példa három változót használ ( A, B, C ), és mindegyikhez két lehetséges hozzárendelés (igaz és hamis) van. Tehát az egyiknek van $2^{3} = 8$ lehetősége. Ebben a kis példában a brute-force keresést használhatjuk az összes lehetséges hozzárendelés kipróbálásához, és ellenőrizhetjük, hogy megfelelnek-e a képletnek.

De realisztikus alkalmazásokban, amelyekben milliónyi változó és klóz található, a brute force keresés nem praktikus. A SAT-megoldó feladata, hogy hatékonyan és gyorsan megtalálja a kielégítő feladatot összetett CNF-képletek különböző heurisztikáinak alkalmazásával.

Unit klóz szabály (unit propagáció vagy egységterjesztés)

Ha egy nem kielégítő klóznak egy kivételével minden literálja vagy változója Hamis értékkel van kiértékelve, akkor a szabad literálnak igaznak kell lennie ahhoz, hogy a klóz igaz legyen. Például, ha az alábbi nem kielégítő klózt a következővel értékeljük ki $A = H a m i s$ és $B = H a m i s$ nekünk kell hogy legyen $C = I g a z$ a klóz érdekében $(A \lor B \lor C)$ hogy igaz legyen.

A unit klóz szabály iterált alkalmazását unit propagációnak vagy Boole-kényszer-propagációnak (BCP) nevezik.

Rezolúció

Vegyünk két kitételt $(A \lor B \lor C)$ és $(\neg C \lor D \lor \neg E)$ . A klóz $(A \lor B \lor D \lor \neg E)$ , amelyet a két klóz egyesítésével és mindkettő eltávolításával kapunk $\neg C$ és $C$ , a két klóz oldójának nevezzük.

Algoritmus

A konfliktus-vezérelt klózok tanulása a következőképpen működik.

Válasszon ki egy változót, és rendelje hozzá az igaz vagy hamis értéket. Ezt döntési állapotnak nevezik. Emlékezzen a feladatra.
Alkalmazza a logikai kényszer propagációt (unit propagáció).
Építsd meg az implikációs gráfot.
Ha bármilyen konfliktus van
1. Keresse meg az implikációs grafikonon azt a vágást, amely az ütközéshez vezetett
2. Hozz létre egy új klózt, amely a konfliktushoz vezető hozzárendelések tagadása
3. Nem kronologikusan visszalépni ("visszaugrás") a megfelelő döntési szintre, ahol az elsőként hozzárendelt, a konfliktusban érintett változót hozzárendelték
Ellenkező esetben folytassa az 1. lépéstől, amíg az összes változóértéket hozzá nem rendeli.

Példa

A CDCL algoritmus vizuális példája:^[4]

Első elágazó változónál válasszuk az x1-et. A sárga kör tetszőleges döntést jelent.
Most alkalmazza a unit propagációt, ami azt eredményezi, hogy x4-nek 1-nek kell lennie (azaz igaznak). A szürke kör a unit propagáció során kényszerített változó hozzárendelést jelent. Az így kapott gráfot implikációs gráfnak nevezzük.
Tetszőlegesen válasszon másik elágazó változót, az x3-at.
Alkalmazza a unit propagációt, és keresse meg az új implikációs gráfot.
Itt az x8 és x12 változók 0-ra, illetve 1-re vannak kényszerítve.
Válasszon egy másik elágazó változót, x2.
Keresse meg az implikációs gráfot.
Válasszon egy másik elágazási változót, az x7-et.
Keresse meg az implikációs gráfot.
Talált konfliktust!
Keresse meg azt a vágást, amely ehhez a konfliktushoz vezetett. A vágásból keressen egy ellentétes állapotot.
Vegyük ennek a feltételnek a tagadását, és tegyük klózzá.
Konfliktus klóz hozzáadása a problémához.
Nem időrendi backtrack a megfelelő döntési szintre, amely ebben az esetben a tanult klóz literáljainak második legmagasabb döntési szintje.
Visszaugrás és változó értékek beállítása ennek megfelelően.

Teljesség

A DPLL egy megbízható és teljes algoritmus a SAT számára. A CDCL SAT megoldói megvalósítják a DPLL-t, de megtanulhatnak új klózokat, és nem kronologikusan léphetnek vissza. A konfliktuselemzéssel végzett klóztanulás nem befolyásolja sem a megalapozottságot, sem a teljességet. Az új klózokat feloldási művelettel azonosítja az ütközéselemzés. ezért minden egyes tanult klóz kikövetkeztethető az eredeti klózból és a többi tanult klózból a feloldási szekvencia sorozatával. Ha cN az új tanult klóz, akkor ϕ akkor és csak akkor teljesíthető, ha ϕ ∪ {cN} is kielégíthető. Ezen túlmenően a módosított backtrack lépés sem befolyásolja a megbízhatóságot vagy a teljességet, mivel a visszalépési információkat minden új tanult klózból kapjuk.^[5]

Alkalmazások

A CDCL algoritmus fő alkalmazása a különböző SAT-megoldókban található, beleértve:

MiniSAT
Zchaff SAT
Z3
Glükóz^[6]
ManySAT stb.

A CDCL algoritmus annyira erőssé tette a SAT-megoldókat, hogy számos alkalmazási területen alkalmazzák hatékonyan a gyakorlatban, mint például a mesterséges intelligencia tervezése, bioinformatika, szoftverteszt-minta generálása, szoftvercsomag-függőségek, hardver- és szoftvermodell-ellenőrzés és kriptográfia.

Kapcsolódó algoritmusok

A CDCL-hez kapcsolódó algoritmusok a Davis–Putnam-algoritmus és a DPLL algoritmus. A DP algoritmus rezolúció cáfolatokat használ, és lehetséges memóriaelérési problémája van. Míg a DPLL algoritmus megfelelő a véletlenszerűen generált példányokhoz, rossz a gyakorlati alkalmazásokban generált példányokhoz. A CDCL hatékonyabb megoldás az ilyen problémák megoldására, mivel a CDCL alkalmazása kevesebb állapottér-keresést biztosít a DPLL-hez képest.

DPLL: nincs tanulás és időrendi visszalépés (backtrack).
CDCL: konfliktus-vezérelt záradéktanulás és nem – kronologikus visszalépés.

Jegyzetek

Sablon:Jegyzetek

Fordítás

Sablon:Fordítás

Források

Sablon:Cite journal
Sablon:Cite journal
Sablon:Hivatkozás/Könyv
Sablon:Hivatkozás/Könyv
Presentation – "SAT-Solving: From Davis-Putnam to Zchaff and Beyond" by Lintao Zhang. (Several pictures are taken from his presentation)

↑ Sablon:Hivatkozás/Könyv
↑ Sablon:Cite journal
↑ Sablon:Hivatkozás/Könyv
↑ ^4,0 ^4,1 In the pictures below, " $+$ " is used to denote "or", multiplication to denote "and", and a postfix "" to denote "not".
↑ Sablon:Hivatkozás/Könyv
↑ Sablon:Cite web

[1] Sablon:Hivatkozás/Könyv

[2] Sablon:Cite journal

[3] Sablon:Hivatkozás/Könyv

[notation-4] 4,0 ^4,1 In the pictures below, " $+$ " is used to denote "or", multiplication to denote "and", and a postfix "" to denote "not".

[5] Sablon:Hivatkozás/Könyv

[6] Sablon:Cite web

[1]

[2]

[3]

[4]

[5]

[6]

Konfliktusvezérelt klóztanulás

Tartalomjegyzék

Háttér

Logikai kielégítési probléma

Unit klóz szabály (unit propagáció vagy egységterjesztés)

Rezolúció

Algoritmus

Példa

Teljesség

Alkalmazások

Kapcsolódó algoritmusok

Jegyzetek

Fordítás

Források

Navigációs menü

Konfliktusvezérelt klóztanulás

Háttér

Logikai kielégítési probléma

Unit klóz szabály (unit propagáció vagy egységterjesztés)

Rezolúció

Algoritmus

Példa

Teljesség

Alkalmazások

Kapcsolódó algoritmusok

Jegyzetek

Fordítás

Források

Navigációs menü

Keresés